File chap12.sav chứa dữ liệu về số lượng thuê bao mới (connect) và thuê bao bị hủy (dsconnect) của công ty Vinsconsin từ năm 1951-1969.
Mô hình mùa vụ ARIMA, trong đó đặc biệt là các mô hình mùa vụ MA đòi hỏi tính toán nhiều hơn so với mô hình phi mùa vụ. Việc tính toán hàm tự tương quan riêng phần (PACF) với độ trễ lớn là cần thiết để nhận dạng các mô hình mùa vụ ARIMA, cũng như thực hiện tính toán tương đối chậm. Cho nên các lệnh trình bày trong ví dụ của phần này chiếm nhiều thời gian hơn so với các lệnh của các phần khác.
15 trang |
Chia sẻ: zimbreakhd07 | Lượt xem: 1301 | Lượt tải: 0
Nội dung tài liệu Thuê bao điện thoại ở Vinsconsin: Mô hình Arima mùa vụ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Lab 6. Thuê bao điện thoại ở Vinsconsin:
Mô hình ARIMA mùa vụ
Biên soạn: TS. Nguyễn Văn Ngọc
File chap12.sav chứa dữ liệu về số lượng thuê bao mới (connect) và thuê bao bị hủy (dsconnect) của công ty Vinsconsin từ năm 1951-1969.
Mô hình mùa vụ ARIMA, trong đó đặc biệt là các mô hình mùa vụ MA đòi hỏi tính toán nhiều hơn so với mô hình phi mùa vụ. Việc tính toán hàm tự tương quan riêng phần (PACF) với độ trễ lớn là cần thiết để nhận dạng các mô hình mùa vụ ARIMA, cũng như thực hiện tính toán tương đối chậm. Cho nên các lệnh trình bày trong ví dụ của phần này chiếm nhiều thời gian hơn so với các lệnh của các phần khác.
Dữ liệu của công ty điện thoại Vinsconsin
Dữ liệu về thuê bao của công ty điện thoại Vinsconsin thường xuyên thay đổi cùng với những thuê bao mới bắt điện thoại và thuê bao cũ cắt điện thoại. Số lượng thuê bao điện thoại mới và thuê bao hủy được đăng ký theo từng tháng. Những dữ liệu này được Tompson và Tiao phân tích năm 1971. Số thuê bao đăng ký mới hiện thời nhiều hơn số thuê bao xin huỷ, do đó hình thành mục tiêu dự báo tăng trưởng của dữ liệu.
Chúng ta sẽ xây dựng mô hình trên cơ sở 190 quan sát, thu thập từ tháng 01 năm 1951 đến tháng 10 năm 1966, dự trữ thêm 25 quan sát bổ sung đến tháng 11 năm 1968 để làm giai đoạn kiểm tra. Đầu tiên ta xác định ngày tháng và thời đoạn của dữ liệu. Bạn chọn trong Menu:
Data
Define Dates…
Trong hộp thoại Define Dates trong danh mục Cases Are Bạn chọn Years, months. Trong nhóm First Case Is Bạn điền năm 1951, để nguyên số 1 trong ô tháng. Nhấp OK.
Bây giờ chọn giai đoạn nghiên cứu. Bạn chọn trong Menu:
Data
Select Cases…
Trong hộp thoại Select Cases Bạn chọn Based on time or case range và nhấp nút Range... để mở hộp thoại Select Cases Range như trên hình 1.
H.1. Hộp thoại «Chọn vùng quan sát».
Hãy để trống các ô của quan sát đầu tiên (Fist Case) (SPSS sẽ mặc định là dữ liệu bắt đầu từ ngày tháng đầu tiên), điền số 1966 vào ô Year cho quan sát cuối cùng (Last Case) và số 10 vào ô Month. Như vậy Bạn đã xác định được giai đoạn nghiên cứu.
Đồ thị chuỗi
Đồ thị 2 chuỗi có tên là connect và dsconnect được trình bày trên H.2.
H.2. Thuê bao mới và thuê bao bị hủy.
Từ đồ thị ta thấy:
Cả 2 chuỗi đều thể hiện dao động mùa vụ với các đỉnh trong tháng 9 và đáy trong tháng 1 hoặc tháng 2.
Các chuỗi có hành vi có vẻ như chúng không độc lập nhau.
Các chuỗi thể hiện xu thế dài hạn.
Sự thay đổi của chuỗi tăng theo mức độ tăng cục bộ của chuỗi.
Ổn định phương sai và biến đổi lô-ga-rít
Các phương pháp ARIMA đều giả định có tính dừng – nghĩa là ít nhất có trung bình và phương sai không đổi. Nếu giá trị trung bình thay đổi theo thời gian, thì nó có thể ổn định nhờ lấy sai phân rời rạc, tuy nhiên điều này không đảm bảo phương sai sẽ không đổi. Nếu chuỗi, như trong trường hợp của chúng ta, phương sai tăng với sự tăng của giá trị trung bình, lấy lô-ga-rít đôi khi cho phép ổn định giá trị này. Phần lớn các thủ thuật của Mô-đun Trends có khả năng thực hiện biến đổi lô-ga-rít «một công đôi việc», khi giữ lại nguyên vẹn chuỗi ban đầu, như vậy không cần biến đổi file dữ liệu.
Ước lượng tốc độ tăng trưởng
Để phân tích sự tăng trưởng số lượng thuê bao điện thoại, chúng ta sẽ xây dựng một chuỗi riêng thể hiện tỷ lệ số thuê bao mới/số thuê bao bị hủy. Bạn chọn trong Menu:
Transform
Compute¼
Trong hộp thoại Compute Variable Bạn chọn biến ratio trong ô Target Variable (Biến mục tiêu). Trong ô Numeric Expression Bạn đưa vào biểu thức connect / dsconnect. Nhấp OK, để tính biến mới ratio, thể hiện tỷ lệ thuê bao mới/thuê bao hủy. Trên hình 3. Trình bày đồ thị chuỗi ratio.
H.3. Tỷ lệ thuê bao mới trên thuê bao hủy.
Cũng như các chuỗi connect và dsconnect, chuỗi ratio là chuỗi có tính mùa vụ, mặc dù biểu hiện đó không rõ như 2 chuỗi trên. Chuỗi ratio cũng có đặc điểm gia tăng sự biến đổi khi tăng giá trị trung bình. Xu thế ít rõ ràng hơn, tuy nhiên để đạt được sự ổn định cho giá trị trung bình cần phải lấy sai phân. Có thể Bạn sẽ cho rằng hiệu số bình thường giữa thuê bao mới và thuê bao hủy có thể dễ dàng diễn giải hơn so với tỷ lệ. Chúng ta phân tích tỷ lệ chủ yếu là vì Tompson và Tiao đã làm như vậy.
Mô hình ARIMA với yếu tố mùa vụ
Mô hình ARIMA mùa vụ phức tạp hơn mô hình không có tính mùa vụ, nhưng nó cũng có những thành phần như mô hình bình thường:
Mô hình AR mùa vụ biểu thị quan sát hiện thời giống như hàm tuyến tính nhiễu loạn hiện thời của một hay nhiều quan sát trước đó.
Sai phân mùa vụ biến đổi dữ liệu bằng cách trừ các quan sát cách xa một mùa vụ. Ví dụ: Khi phân tích dữ liệu tháng, Bạn hãy trừ các quan sát cùng một tháng của năm trước đó. Nếu như sai phân rời rạc bình thường làm giảm độ dài của chuỗi đi một quan sát, thì sai phân mùa vụ làm giảm độ dài của chuỗi một thời đoạn mùa vụ (nghĩa là giảm đi số quan sát trong một thời đoạn).
Mô hình MA mùa vụ biểu thị quan sát hiện thời giống như hàm tuyến tính nhiễu loạn hiện thời của một hay nhiều quan sát trước đó.
Đối với mô hình ARIMA mùa vụ Bạn phải chỉ ra giai đoạn. Chuỗi các chỉ số theo tháng như ratio, thường có thời đoạn mùa vụ là 12, tuy nhiên có thể có các thời đoạn khác. Như với thủ thuật Define Date chúng ta chỉ ra năm và tháng, mô-đun Trends giả định thời đoạn của chuỗi ratio bằng 12.
Trong cách viết truyền thống của mô hình ARIMA mùa vụ, độ dài thời đoạn mùa vụ chỉ ra sau dấu ngoặc, chứa các tham số p, d và q. Như vậy, mô hình với thời đoạn bằng 12, MA mùa vụ bậc 1, lấy sai phân mùa vụ 1 lần có thể viết như sau: ARIMA (0,1,1)12.
Trong đó: μ – Giá trị trung bình của quá trình sai phân mùa vụ;
Ω1 – tham số mùa vụ của MA.
Vấn đề nhận diện các mô hình mùa vụ
Mặc dù mô hình ARIMA mùa vụ có quan điểm giống với mô hình phi mùa vụ, nhưng nhận diện chúng thường mất nhiều công sức hơn.
Độ dài của chuỗi
Để xây dựng mô hình mùa vụ cần chuỗi có độ dài đủ lớn. Với thời đoạn 12 như trong ví dụ của chúng ta, Bạn cần nhận diện dạng mô hình trên cơ sở ACF và PACF với các độ trễ 12, 24, 36... Bạn cần phải tính những hàm này với một số lượng lớn độ trễ, được xác định trong hộp thoại Autocorrelations Options. Chúng ta nhận thấy rằng tình toán PACF cho số độ trễ lớn như vậy đòi hỏi rất nhiều thời gian. Bạn đừng chọn số độ trễ lớn như vậy nếu như Bạn không có ý định ước lượng mô hình mùa vụ.
Để ước lượng các hệ số cho mô hình ARIMA mùa vụ cần có dữ liệu ít nhất là 7 hoặc 8 thời đoạn. Mô hình được xây dựng trên chuỗi càng ngắn càng không đáng tin cậy.
Tác động lẫn nhau của các hiệu ứng mùa vụ và phi mùa vụ
Tính chất của ACF và PACF đặc trưng cho các quá trình có tính mùa vụ cũng tương tự như đối với quá trình phi mùa vụ. Khác nhau ở chỗ là qui luật xuất hiện trong một vài độ trễ mùa vụ đầu tiên, chứ không phải là trong một vài độ trễ đầu tiên thông thường. Xác định quá trình có tính mùa vụ rất dễ: Nếu như ACF và/hoặc PACF có giá trị lớn trong các độ trễ là bội số của độ dài mùa vụ, thì quá trình là mùa vụ. Làm việc với các quá trình hỗi hợp thì khó hơn.
Vấn đề mang tính nguyên tắc là khi nhận diện mô hình mùa vụ phải xây dựng đồ thị ACF và PACF. Những đồ thị này được sinh ra bởi tổ hợp các quá trình mùa vụ và phi mùa vụ với nhiễu ngẫu nhiên và hiếm khi rõ ràng như trình bày trong các giáo trình. Trên thực tế thường tiến hành trước tiên là nhận diện mô hình được giải thích bởi một phần qui luật, ước lượng các hệ số của nó, và sau đó là nghiên cứu ACF và PACF phần dư của mô hình để xác định những thành phần nào sẽ được thêm vào. Quá trình nhận diện, ước lượng và dự báo ARIMA khi hiện diện yếu tố mùa vụ chiếm tương đối nhiều thời gian.
Mô hình mùa vụ cho công ty điện thoại
Ta bắt đầu phân tích chuỗi ratio với việc xây dựng đồ thị ACF. Như đã giải thích ở trên trong mục «Ổn định phương sai và biến đổi lô-ga-rít» để ổn định phương sai sử dụng phép biến đổi lô-ga-rít. Để có được đồ thị theo yêu cầu, Bạn chọn trong Menu:
Graphs
Time Series
Autocorrelations¼
Hộp thoại Autocorrelations được mở ra như hình 4.
H.4. Hộp thoại của thủ thuật «Tự tương quan».
Đưa biến ratio vào danh mục Variables. Để giảm bớt thời gian xử lý, hãy bỏ tuỳ chọn Partial autocorrelations trong nhóm Display. Vì tính PACF đòi hỏi nhiều thời gian, mà chúng ta chưa xác định được chuỗi đã dừng hay chưa. Trong nhóm Transform cần phải chỉ ra thời đoạn hiện hành (Current periodicity), bằng 12. Trong nhóm này bạn hãy chọn Natural log transform. Hãy nhập nút Options để mở ra hộp thoại tương ứng, H. 5.
H. 5. Hộp thoại “ Options” của thủ thuật “Tự tương quan”.
Trong ô Maximum Number of Lags bạn điền số 36. Điều này cho 3 độ trễ mùa vụ (độ trễ 12, 24 và 36) để nhận dạng mô hình mùa vụ. Hãy nhấp OK để nhận được hàm tự tương quan của chuỗi ratio.
H. 6. Đồ thị ACF với biến đổi lô-ga-rít.
Nhận dạng mô hình mùa vụ
Đồ thị ACF, trình bày trên hình 6, Chỉ ra các giá trị lớn trong các độ trễ 12, 24 và 36. Các giá trị này giảm dần, khẳng định nghi ngờ của chúng ta là để đạt được sự ổn định của giá trị trung bình cần phải lấy sai phân rời rạc. Để thực hiện điều đó, trước tiên Bạn mở hộp thoại Autocorrelations. Bạn chọn Seasonally difference trong nhóm Transform, và Partial autocorrelations trong nhóm Display. Bạn nên nhớ rằng tính toán PACF với độ trễ lớn đòi hỏi nhiều thời gian. Trên hình 7 trình bày các đồ thị sau khi đã lấy sai phân mùa vụ rời rạc.
H. 7. Đồ thị sau khi tiến hành lấy sai phân mùa vụ.
Sai phân mùa vụ san bằng dao động mùa vụ nhanh. ACF giống như trước chỉ ra số lượng lớn tác động phi mùa vụ, với đỉnh mùa vụ riêng trong độ trễ 12. Trên đồ thị PACF ta thấy đỉnh lớn trong độ trễ 12, đỉnh nhỏ trong độ trễ 24, và mập mờ trong độ trễ 36.
Chúng ta đã biết rằng qui luật «một đỉnh trong ACF, giảm nhanh trong PACF» chỉ ra quá trình MA(1), trong trường hợp của chúng ta là quá trình mùa vụ MA(1), vì qui luật thể hiện trong các độ trễ mùa vụ.
Đồ thị này được xây dựng sau khi tiến hành lấy sai phân rời rạc, do đó mô hình mùa vụ trung gian là (0,1,1). Bước tiếp theo là ước lượng hệ số của MA(1) trong mô hình mùa vụ, để chúng ta có thể xây dựng đồ thị ACF của phần dư và có được sự thể hiện rõ ràng hơn về mô hình phi mùa vụ.
Ước lượng hệ số mùa vụ
Để ước lượng mô hình mùa vụ, Bạn chọn trong Menu:
Analyze
Time Series
ARIMA...
Hộp thoại ARIMA được mở ra, H. 8.
H. 8. Hộp thoại ARIMA.
Bạn hãy đưa biến ratio vào ô Dependent.
Bạn chọn Natural log trong danh mục Transform. Như đã bàn ở trên, phép biến đổi lô-ga-rít được đưa vào mô hình là nhằm ổn định sự phân tán.
Trong nhóm Model hãy hủy bỏ tuỳ chọn Include constant in model. Giá trị trung bình của chuỗi sau khi biến đổi sai phân (có mùa vụ hoặc không) phải gần bằng 0.
Thiết lập các tham số mô hình mùa vụ: đặt sd bằng 1 và sq bằng 1. Bốn tham số còn lại đặt bằng 0.
Nhấp vào Options..., xuất hiện hộp thoại ARIMA Options Bạn hãy chọn Final parameters only. Chúng ta không quan tâm đến chi tiết xây dựng mô hình mà là kết quả.
Từ những đồ thị đã trình bày ở trên chúng ta biết rằng, ảnh hưởng đến quá trình có cả những nguyên nhân phi mùa vụ. Khi ước lượng mô hình phi mùa vụ chúng ta hy vọng nhận được chuỗi từ phần còn lại sau khi loại bỏ tác động mùa vụ. Kết quả phân tích sơ bộ được trình bày trên hình 9.
Split group number: 1 Series length: 190
No missing data.
Melard's algorithm will be used for estimation.
Conclusion of estimation phase.
Estimation terminated at iteration number 6 because:
Sum of squares decreased by less than .001 percent.
FINAL PARAMETERS:
Number of residuals 178
Standard error .07520585
Log likelihood 205.85675
AIC -409.7135
SBC -406.53172
Analysis of Variance:
DF Adj. Sum of Squares Residual Variance
Residuals 177 1.0310954 .00565592
Variables in the Model:
B SEB T-RATIO APPROX. PROB.
SMA1 .59551885 .06601872 9.0204542 .0000000
The following new variables are being created:
Name Label
FIT_1 Fit for RATIO from ARIMA, MOD_5 LN NOCON
ERR_1 Error for RATIO from ARIMA, MOD_5 LN NOCON
LCL_1 95% LCL for RATIO from ARIMA, MOD_5 LN NOCON
UCL_1 95% UCL for RATIO from ARIMA, MOD_5 LN NOCON
SEP_1 SE of fit for RATIO from ARIMA, MOD_5 LN NOCON
Note: The error variable is in the log metric.
H.9. Ước lượng mô hình mùa vụ ARIMA(0,1,1).
Nhận diện mô hình phi mùa vụ theo phần dư
Chuỗi err_1 chứa phần dư từ ước lượng mô hình mùa vụ nhận được ở trên của chuỗi biến đổi lô-ga-rít ratio. Nếu như chúng ta nhận diện thành công mô hình mùa vụ, thì phần dư đó phải chỉ ra phần phi mùa vụ của mô hình. (Trong trường hợp ngược lại, chúng giống như trước sẽ chỉ ra tự tương quan trong các độ trễ mùa vụ). Để nhận diện các thành phần phi mùa vụ của mô hình, Bạn chọn trong Menu:
Graphs
Time Series
Autocorrelations...
Trong hộp thoại Autocorrelations Bạn hãy loại bỏ biến ratio ra khỏi danh sách biến (Variables), và đưa biến err_1 vào. Bạn phải chắc chắn rằng đã chọn cả 2 tuỳ chọn của khung Display. Dỡ bỏ tuỳ chọn Natural log transform và Seasonally difference trong nhóm Transform. Trong các hình 10 và 11 trình bày đồ thị ACF và PACF phần dư của mô hình mùa vụ ARIMA.
H.10. Đồ thị ACF của phần dư mô hình mùa vụ.
H.11. Đồ thị PACF của phần dư mô hình mùa vụ.
Vì tuỳ chọn trước đây xác định độ trễ maximum vẫn giữ nguyên nên môđun TRENDS đưa ra tự tương quan cho 36 độ trễ. (Chúng ta muốn nhìn thấy các độ trễ bậc cao là để kiểm tra xem sự thay đổi về mùa vụ đã được lưu vào phần dư hay chưa). Từ hình vẽ ta thấy rằng:
Các giá trị ACF cao trong giai đoạn đầu và sau đó tắt dần.
Các giá trị PACF cũng tắt dần, nhưng nhanh hơn một chút.
Khi so sánh qui luật quan sát với phần trình bày trong chương lý thuyết chúng ta kết luận rằng qui luật phi mùa vụ thể hiện bởi mô hình ARIMA (1,0,1). Sự tắc dần tương đối chậm của hàm ACF chỉ ra rằng hệ số tự hồi qui lớn. (Cần nhớ rằng, khi ACF giảm chậm điều này cũng có nghĩa là chuỗi được diễn giải tương đương với mô hình AR(1) với hệ số 1.0.)
Trước khi ước lượng các hệ số của mô hình hỗn hợp, chúng ta dừng lại một chút để làm rõ những đặc trưng cơ bản như mô-đun Trends biến đổi lô-ga-rít dữ liệu như thế nào.
Phần dư đối với chuỗi lô-ga-rít
Các tuỳ chọn biến đổi lô-ga-rít trong thủ thuật ARIMA cho phép phân tích lô-ga-rít của chuỗi, khi giữ nguyên file làm việc không đổi. Để ước lượng mô hình như vậy cần phần dư của chuỗi phân tích, nói cách khác - cần dữ liệu đã biến đổi. Như vậy, nếu như Bạn chọn một trong hai phép biến đổi lô-ga-rít trong hộp thoại ARIMA, chuỗi phần dư (với tiếp tố err) dường như đã được biến đổi. Tất cả những chuỗi khác được tạo ra bởi thủ thuật ARIMA (với các tiếp tố fit, lcl, ucl, và sep) được biến đổi ngược lại, sao cho chúng có thể so sánh được với chuỗi phân tích.
Cho nên khi trong ARIMA Bạn sử dụng phép biến đổi lô-ga-rít, tổng số giữa chuỗi fit và chuỗi err không bằng chuỗi ban đầu. Chuỗi fit không biến đổi, để cho nó có thể dễ dàng so sánh với chuỗi ban đầu; chuỗi err được biến đổi với mục tiêu dự báo.
Cần chú ý là chúng ta chưa làm phép biến đổi lô-ga-rít cho đồ thị ACF trình bày trên hình 10, như chúng ta đã làm trước đây. Chuỗi err_1 (khác với chuỗi ratio trên hình 7) không thể hiện trong thước đo lô-ga-rít.
Ước lượng mô hình đầy đủ
Mô hình trung gian, bao gồm các hiệu ứng mùa vụ và phi mùa vụ, có dạng (1,0,1)(0,1,1)12. Để ước lượng mô hình, Bạn chọn trong Menu:
Statistics
Time Series
ARIMA¼
Bạn phải chắc chắn rằng, trong hộp thoại ARIMA biến ratio với tư cách là biến phụ thuộc đã được chọn, và đã chọn phép biến đổi lô-ga-rít. Điền giá trị 1 cho các biến p và q. Giữ nguyên d bằng 0, và 3 biến mùa vụ bằng 0, 1 và 1 tương ứng. Hãy chắc là không chọn clude constant in model (Đưa constant vào mô hình).
Nhấp nút Save... , để kiểm tra các tuỳ chọn tạo biến mới. Cần phải chọn các tuỳ chọn theo mặc định: Add to file (Thêm vào file) và Predict from estimation period through last case (Dự báo từ giai đoạn nghiên cứu đến quan sát cuối cùng). Nhấp nút Continue, và sau đó nút Options... trong hộp thoại ARIMA. Trong hộp thoại ARIMA Options, Bạn hãy chọn tuỳ chọn đầu tiên của khung Display – Initial and final parameters with iteration summary (Các tham số đầu tiên và cuối cùng với kết quả các phép lặp).
Trên hình 12. trình bày ước lượng mô hình trên. Tất cả các hệ số đều có ý nghĩa thống kê, giống như mong đợi, hệ số AR(1) gần bằng 1.
Split group number: 1 Series length: 190
No missing data.
Melard's algorithm will be used for estimation.
Conclusion of estimation phase.
Estimation terminated at iteration number 5 because:
Sum of squares decreased by less than .001 percent.
FINAL PARAMETERS:
Number of residuals 178
Standard error .05363987
Log likelihood 266.10097
AIC -526.20195
SBC -516.6566
Analysis of Variance:
DF Adj. Sum of Squares Residual Variance
Residuals 175 .52400402 .00287724
Variables in the Model:
B SEB T-RATIO APPROX. PROB.
AR1 .91658654 .03955866 23.170311 .0000000
MA1 .52165306 .08352885 6.245184 .0000000
SMA1 .65676324 .06741673 9.741844 .0000000
The following new variables are being created:
Name Label
FIT_2 Fit for RATIO from ARIMA, MOD_7 LN NOCON
ERR_2 Error for RATIO from ARIMA, MOD_7 LN NOCON
LCL_2 95% LCL for RATIO from ARIMA, MOD_7 LN NOCON
UCL_2 95% UCL for RATIO from ARIMA, MOD_7 LN NOCON
SEP_2 SE of fit for RATIO from ARIMA, MOD_7 LN NOCON
Note: The error variable is in the log metric.
H.12. Mô hình đầy đủ.
Dự báo
Như trên hình 12, phần dư để xây dựng mô hình được ghi trong chuỗi err_2. Giống như trước, chuỗi phần dư thể hiện trong thước đo lô-ga-rít để thuận tiện cho việc dự báo. Trên hình 13 đồ thị ACF của chuỗi err_1 thể hiện dưới dạng text, với các giá trị và mức ý nghĩa thống kê Box- Jung.
Autocorrelations: ERR_2 Error for RATIO from ARIMA, MOD_7 LN NOC
Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 .010 .074 . * . .018 .894
2 -.079 .074 .**I . 1.141 .565
3 .094 .074 . I**. 2.770 .428
4 -.046 .074 . *I . 3.153 .533
5 .026 .073 . I* . 3.280 .657
6 .070 .073 . I* . 4.199 .650
7 -.013 .073 . * . 4.233 .753
8 .097 .073 . I**. 6.014 .646
9 -.070 .073 . *I . 6.952 .642
10 -.074 .072 . *I . 7.991 .630
11 .233 .072 . I**.** 18.406 .073
12 -.071 .072 . *I . 19.380 .080
13 -.105 .072 .**I . 21.519 .063
14 .081 .072 . I**. 22.813 .063
15 -.018 .071 . * . 22.877 .087
16 -.045 .071 . *I . 23.276 .107
17 -.035 .071 . *I . 23.517 .133
18 -.052 .071 . *I . 24.060 .153
19 .000 .070 . * . 24.060 .194
20 -.086 .070 .**I . 25.565 .181
21 -.126 .070 ***I . 28.801 .119
22 -.019 .070 . * . 28.876 .148
23 -.003 .070 . * . 28.878 .184
24 -.011 .069 . * . 28.902 .224
25 -.005 .069 . * . 28.908 .268
26 -.066 .069 . *I . 29.830 .275
27 -.083 .069 .**I . 31.307 .259
28 -.030 .068 . *I . 31.497 .295
29 .055 .068 . I* . 32.143 .314
30 .090 .068 . I**. 33.888 .285
31 .012 .068 . * . 33.922 .328
32 -.034 .068 . *I . 34.175 .364
33 -.033 .067 . *I . 34.421 .400
34 .048 .067 . I* . 34.937 .423
35 .065 .067 . I* . 35.877 .427
36 .089 .067 . I**. 37.685 .392
Plot Symbols: Autocorrelations * Two Standard Error Limits .
Total cases: 190 Computable first lags: 177
H.13. ACF phần dư của mô hình đầy đủ.
Chúng ta nhìn thấy đỉnh trong độ trễ 11. Chúng ta không có cơ sở để kỳ vọng tự tương quan ở độ trễ 11 và chúng ta đã tính rất nhiều giá trị để cho một hoặc hai trong số đó có giá trị lớn một cách hoàn toàn ngẫu nhiên, để chúng ta có thể yên tâm bỏ qua đỉnh đó. Thống kê Box- Jung không phát hiện độ lệch từ nhiễu trắng có ý nghĩa trong tự tương quan phần dư.
Kiểm tra trên giai đoạn kiểm soát
Để tiến hành dự báo mô hình trên giai đoạn kiểm soát (25 quan sát chưa được sử dụng khi ước lượng các hệ số), chúng ta xây dựng chuỗi ban đầu và chuỗi mới fit_2 cho tất cả file dữ liệu. Bạn chọn trong Menu:
Data
Select Cases...
H.14. Hộp thoại «Đồ thị theo trục thời gian».
Trong hộp thoại Select Cases nhấp nút Range¼ và thiết lập cho Fist Case trong ô Year năm 1959, và số 1 trong ô Month. Xoá các ô liên quan đến Last Case. Giai đoạn nhận được đủ ngắn để cho trên sơ đồ có thể quan sát chuỗi được chi tiết.
Bây giờ chọn trong Menu:
Graphs
Sequence¼
Đưa biến ratio và fit_2 vào danh sách Variables, đưa biến date_ vào ô Time Axis Labels (Đánh dấu trên trục thời gian). Nhấp Time Lines..., để mở ra hộp thoại Time Axis Reference Lines, như hình 14.
Chọn tuỳ chọn Line at date (Đường tại điểm tương ứng với năm tháng) và điền vào năm tháng, thể hiện dấu hiệu hết giai đoạn nghiên cứu: năm 1966, tháng 10. Như vậy trên đồ thị dễ dàng xác định nơi bắt đầu giai đoạn kiểm soát. Kết quả được trình bày trên hình 15.
H.15. Đồ thị kế tiếp nhau đối với các giá trị thực tế và giá trị dự báo của chuỗi ratio.
Trừ một vài ngoại lệ, chuỗi fit của mô hình ARIMA mùa vụ có thành phần mùa vụ theo dõi tốt tỷ lệ thuê bao mới/ thuê bao hủy.
Các file đính kèm theo tài liệu này:
- lab_6_arima_3.doc