Bài giảng Dự báo trong kinh doanh - Chương 7: Phương pháp Box - Jenkins

- Phương pháp Box-Jenkins.

- Các mô hình tự hồi qui (AR).

- Các mô hình trung bình động (MA).

- Các mô hình hồi qui và trung bình động (ARMA).

- Xây dựng mô hình Box-Jenkins.

- Các tiêu chí chọn lựa mô hình.

- San bằng số mũ đơn giản và mô hình ARIMA.

- Ưu và nhược điểm của các mô hình ARIMA.

34 trang | Chia sẻ: zimbreakhd07 | Lượt xem: 4748 | Lượt tải: 1

Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Dự báo trong kinh doanh - Chương 7: Phương pháp Box - Jenkins, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

KHOA KINH TEÁ DÖÏ BAÙO TRONG KINH DOANH BUSINESS FORECASTING Chương 7. PHƯƠNG PHÁP BOX-JENKINS (AutoRegressive Integrated Moving Average - ARIMA) Phương pháp Box-Jenkins Các mô hình tự hồi qui (AR) Các mô hình trung bình động (MA) Các mô hình hồi qui và trung bình động (ARMA) Xây dựng mô hình Box-Jenkins Các tiêu chí chọn lựa mô hình San bằng số mũ đơn giản và mô hình ARIMA Ưu và nhược điểm của các mô hình ARIMA 1. Phương pháp Box-Jenkins Phương pháp luận dự báo theo mô hình Box-Jenkins khác với nhiều mô hình khác, vì không cần giả định bất kỳ một mô hình cụ thể nào cho dữ liệu chuỗi thời gian cần dự báo. Phương pháp này lần lượt thử các mô hình khác nhau cho đến khi tìm được mô hình phù hợp. Mô hình được cho là phù hợp nếu như phần dư là nhỏ nhất, phân phối ngẫu nhiên và độc lập lẫn nhau. 1. Phương pháp Box-Jenkins Yes No Xác định loại mô hình tổng thể Chọn mô hình để kiểm định thực nghiệm Ước lượng tham số khi kiểm định thực nghiệm Kiểm định mô hình (phù hợp hay không?) Sử dụng mô hình để dự báo Hình 7.1. Sơ đồ chiến lược lựa chọn mô hình theo mô hình Box - Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins Hình 7.4. Các hệ số tự tương quan và tự tương quan từng phần của mô hình hỗn hợp ARMA(1,1). Mô hình tự hồi qui tổng quát bậc p có dạng: Yt = θ0 + θ1Yt-1 + θ2Yt-2 +…+ θpYt-p + εt Trong đó: Yt: Phản ứng (Biến phụ thuộc) tại thời điểm t. Yt-1, Yt-2, …, Yt-p: Phản ứng tại các giá trị của thời đoạn t-1, t-2,…, t-p tương ứng. θ0, θ1, θ2,…, θp: Các hệ số ước lượng. εt: Sai số, miêu tả ảnh hưởng của các tham số trong mô hình. 2. Các mô hình tự hồi qui (AR) Ví dụ: Bảng dự báo sử dụng mô hình tự hồi qui AR (2) 2. Các mô hình tự hồi qui (AR) Giả sử tại thời điểm t-1=75 cần phải dự báo về các quan sát cho giai đoạn tiếp theo t=76. Vì đại lượng sai số tối ưu là đại lượng mà giá trị trung bình của nó bằng 0, dự báo cho giai đoạn t=76 như sau: Đối với các mô hình tự hồi qui, dự báo phụ thuộc vào dữ liệu quan sát trong quá khứ. Mô hình AR(2), dự báo phụ thuộc vào giá trị quan sát trong 2 thời đoạn trước đó. Mô hình AR(3), dự báo phụ thuộc vào giá trị quan sát trong 3 thời đoạn trước đó… 2. Các mô hình tự hồi qui (AR) Mô hình trung bình động bậc q có dạng: Yt = μ + εt - ω1εt-1 - ω2εt-2 - … - ωqεt-q Trong đó: Yt: Phản ứng (biến phụ thuộc) tại thời điểm t. μ: Trung bình tĩnh của quá trình. ω1, ω2, …, ωq: Các hệ số ước lượng. εt: Sai số trong các thời đoạn trước, mà tại thời điểm t bao gồm Yt. Mô hình MA dự báo giá trị Yt dựa trên phối hợp tuyến tính ràng buộc bởi các sai số trong quá khứ, trong khi đó mô hình tự hồi qui AR dự báo trên cơ sở hàm tuyến tính ràng buộc bởi các giá trị Yt trong quá khứ. 3. Các mô hình trung bình động (MA) Biểu thức trung bình động liên quan đến nhân tố làm sai lệch dự báo với trung bình của nó, Yt – μ là sự phối hợp tuyến tính giữa sai số hiện tại với sai số quá khứ, vì thời gian chuyển động về phía trước, nên các sai số trong sự phối hợp đó cũng sẽ dịch chuyển về phía trước. Yt – μ = εt - ω1εt-1 - ω2εt-2 - … - ωqεt-q Yt+1 – μ = εt+1 - ω1εt - ω2εt-1 - … - ωqεt-q+1 Tổng các trọng số ω1, ω2, …, ωq không nhất thiết phải bằng 1 và có thể dương, có thể âm. 3. Các mô hình trung bình động (MA) Ví dụ: Bảng dự báo sử dụng mô hình trung bình trượt MA (2) 3. Các mô hình trung bình động (MA) Giả sử tại thời đoạn t-1=75, cần dự báo cho giai đoạn tiếp theo t=76. Vì với thời điểm t-1, sai số là đại lượng tối ưu, khi giá trị trung bình của nó bằng 0 và ước lượng tốt nhất giá trị sai số hiện tại và thời đoạn trước, đó là các phần dư tương ứng, thì dự báo cho giai đoạn t=76 sẽ như sau: 3. Các mô hình trung bình động (MA) Cần chú ý rằng tính dự báo cho giai đoạn 76 hai phần dư e75 và e74 thay cho sai số ε75 và ε74. Khi tính dự báo bằng mô hình MA, sai số tương ứng với các thời đoạn quá khứ được thay bằng các phần dư đối với các thời đoạn ấy. Số lượng phần dư trong mô hình dự báo bằng số bậc của mô hình MA. 3. Các mô hình trung bình động (MA) Có thể phối hợp mô hình tự hồi qui và mô hình trung bình động với nhau và kết quả là mô hình “hỗn hợp”- Hồi qui-trung bình-động. Khi miêu tả mô hình này, thường sử dụng kí hiệu ARMA(p,q), trong đó p - bậc của phần tự hồi qui, và q - bậc của phần trung bình động. Mô hình ARMA(p,q) có dạng: Yt = θ0 + θ1Yt-1 + θ2Yt-2 +…+ θpYt-p + εt - ω1εt-1 - ω2εt-2 - … - ωqεt-q Mô hình ARMA(p,q) miêu tả một phạm vi rộng hành vi của chuỗi thời gian dừng. Mô hình ARMA(p,q) làm dự báo vừa phụ thuộc vào giá trị hiện thời và giá trị quá khứ của Y, cũng như phụ thuộc vào giá trị hiện thời và quá khứ của sai số (phần dư) et. 4. Các mô hình tự hồi qui và trung bình động (ARMA) 4. Các mô hình hồi qui và trung bình động (ARMA) Hành vi của các hệ số tự tương quan và tự tương quan từng phần trong các mô hình tự hồi qui và trung bình động. Giai đoạn 1. Xác định mô hình 1. Trong giai đoạn nhận diện mô hình cần làm rõ chuỗi dữ liệu có phải là chuỗi dừng hay không. Thường thì chuỗi không dừng có thể biến đổi thành chuỗi dừng bằng cách lấy sai phân. Trong trường hợp này mô hình ARMA được xác định cho chuỗi sai phân. Giả sử chuỗi ban đầu Yt, có xu thế tăng theo thời gian, nhưng sai phân bậc 1 của nó ΔYt = Yt - Yt-1, biến đổi xoay quanh một giá trị nhất định nào đó. Ví dụ: ΔYt =θ1ΔYt-1 + εt – ω1εt-1 Hoặc: (Yt - Yt-1) =θ1(Yt-1 - Yt-2) + εt – ω1εt-1. 5. Xây dựng mô hình Box-Jenkins Trong một số trường hợp, để có được chuỗi dừng, cần phải tìm sai phân của sai phân. Thủ tục lấy sai phân được thực hiện 2 lần, kết quả sẽ là chuỗi dữ liệu dừng. Δ2Yt = Δ(ΔYt) = Δ(Yt - Yt-1) =Yt -2Yt-1 + Yt-2. Về nguyên tắc, lấy sai phân có thể tiến hành cho đến khi nào đồ thị dữ liệu không cho thấy chuỗi biến động lân cận một giá trị cố định nào đó, còn tự tương quan mẫu tương đối giảm đột ngột. Số lần lấy sai phân cần thiết để có chuỗi dữ liệu dừng được ký hiệu là d. Các mô hình cho chuỗi dữ liệu không dừng gọi là mô hình tự hồi qui trung bình động tích hợp và ký hiệu là ARIMA(p, d, q). Nếu chuỗi ban đầu là chuỗi dừng thì d=0 và mô hình ARIMA trở thành ARMA. 5. Xây dựng mô hình Box-Jenkins 2. Sau khi có được chuỗi dừng, cần phải xác định đặc điểm chung của mô hình. Việc chọn mô hình phụ thuộc vào việc so sánh các kiểu chuyển vận của hệ số tự tương quan và tự tương quan từng phần. - Nếu hàm tự tương quan mẫu giảm mạnh tại một vài điểm, còn tự tương quan từng phần giảm đều về 0, ví dụ tại q giá trị, khi đó mô hình phù hợp là MA(q). - Nếu hàm tự tương quan mẫu giảm đều theo dạng hàm mũ, còn tự tương quan từng phần giảm mạnh tại một vài điểm, ví dụ sau p giá trị, mô hình phù hợp là AR(p). - Nếu cả 2 hàm tự tương quan và tự tương quan từng phần không giảm mạnh mà dần tiến về 0, khi đó chọn mô hình ARMA(p, q). 5. Xây dựng mô hình Box-Jenkins Giai đoạn 2. Ước lượng mô hình 1. Ước lượng các tham số của mô hình. Trong mô hình ARIMA giá trị các tham số được chọn bằng cách tối thiểu hoá tổng bình phương sai số (phương pháp bình phương phi tuyến bé nhất). Ví dụ: Giả sử mô hình ARIMA(1,0,1) được đối chiếu với chuỗi 100 quan sát và phương trình thực có dạng sau: (7,02) (0,17) (0,21) Vì tỉ số t đối với hệ số đứng trước số hạng tự hồi qui sẽ là t=0,25/0,17=1,47 (với p=0,14), giả thuyết H0: θ1=0 chấp nhận và số hạng này có thể loại khỏi mô hình. Khi đó ta áp dụng mô hình ARIMA(0,0,1), nghĩa là MA(1). 5. Xây dựng mô hình Box-Jenkins 2. Tính sai số phần dư bình phương trung bình s2 và ước lượng sự thay đổi sai số εt. Sai số phần dư bình phương trung bình được xác định theo công thức: Trong đó: : phần dư tại thời điểm t; n: số lượng phần dư; r: tổng số số tham số được ước lượng. Sai số phần dư bình phương trung bình dùng để so sánh và đánh giá các mô hình khác nhau. Ngoài ra nó còn được sử dụng để xác định giới hạn sai số của dự báo. 5. Xây dựng mô hình Box-Jenkins Giai đoạn 3. Kiểm định mô hình 1. Phần lớn các đồ thị phần dư, áp dụng trong phân tích hồi qui, có thể sử dụng để phân tích phần dư trong mô hình ARIMA. Biểu đồ tần xuất phần dư và đồ thị phân phối chuẩn của chúng đặc biệt hữu ích (Để kiểm định tính chuẩn), cũng như đồ thị trình tự của chúng theo thời gian (để kiểm định độ phân tán của các giá trị). 2. Các hệ số tự tương quan phần dư riêng lẻ rk(e) phải nhỏ và phải nằm trong lân cận 0 bên trong khoảng ± . Tự tương quan phần dư lớn đáng kể ở các thời đoạn trễ nhỏ hoặc có tính mùa vụ, nghĩa là mô hình lựa chọn không phù hợp và cần phải chọn mô hình khác hoặc thay đổi mô hình hiện tại. 5. Xây dựng mô hình Box-Jenkins 3. Hành vi của hàm tự tương quan phần dư, nói chung phải tương ứng với tự hồi qui nhận được đối với tập hợp sai số ngẫu nhiên. Kiểm định chung tính phù hợp của mô hình được thực hiện nhờ test χ2, dựa trên thống kê Q Ljung-Box. Đây là test kiểm định qui mô chung của các hệ số tự tương quan phần dư. Test thống kê Q có dạng: Trong đó: - rk(e): tự hồi qui phần dư trong khoảng k; - n: số phần dư; - m: số thời đoạn trong kiểm định. Thống kê Q có phân phố gần giống phân phối ngẫu nhiên χ2 với n-r bậc tự do, trong đó r- tổng số số tham số phù hợp của mô hình ARIMA. 5. Xây dựng mô hình Box-Jenkins Giai đoạn 4. Dự báo dựa vào mô hình lựa chọn 1. Khi tìm được mô hình phù hợp có thể tiến hành dự báo cho một hoặc vài thời đoạn tiếp theo. 2. Khi vừa có dữ liệu quan sát mới, mô hình ARIMA có thể áp dụng để thay đổi dự báo, với thời điểm tính thời gian khác. 3. Nếu đặc điểm hành vi của chuỗi bị thay đổi, dữ liệu mới có thể dùng để ước lượng lại các tham số mô hình, hoặc khi cần thiết xây dựng mô hình mới. 5. Xây dựng mô hình Box-Jenkins Nếu như các mô hình có chứa cùng một lượng tham số như nhau, thì thường sẽ ưu tiên chọn mô hình có sai số bình phương trung bình (s2) nhỏ nhất. Tuy nhiên, các mô hình có số lượng tham số nhiều hơn có thể có sai số bình phương trung bình nhỏ. Mô hình được lựa chọn là mô hình có AIC hoặc BIC tối thiểu. Tiêu chuẩn thông tin Akaike (AIC) Trong đó: ln: lô-ga-rít tự nhiên; : tổng bình phương phần dư, chia cho tổng số quan sát; n: số lượng quan sát (phần dư); r: tổng số các số hạng trong mô hình ARIMA (kể cả số hạng là hằng số). 6. Các tiêu chí chọn lựa mô hình Tiêu chuẩn thông tin Bayes (BIC) Đại lượng thứ 2 trong hai công thức trên là “nhân tố phạt”, tính khi đưa vào tham số bổ sung vào mô hình. Tiêu chuẩn BIC đặt lên hạn chế lớn số lượng các tham số so với tiêu chuẩn AIC. Như vậy tối thiểu hoá tiêu chuẩn BIC khi lựa chọn mô hình bao giờ cũng cho số lượng tham số, không lớn hơn số lượng tham số thiết lập theo tiêu chuẩn AIC. Thường thì cả 2 tiêu chuẩn này đều cho cùng một kết quả. 6. Các tiêu chí chọn lựa mô hình 6. Các tiêu chí chọn lựa mô hình Trong các mô hình ARIMA riêng biệt để dự báo, cũng gần giống như khi sử dụng phương pháp san bằng số mũ. Để minh hoạ cho khẳng định trên, ta xem xét mô hình ARIMA(0,1,1). Giả sử, điểm dự báo đầu tiên là t và cần phải dự báo cho Yt+1. Thay t bằng t+1 vào phương trình trên ta có: Vì trong thời đoạn t, giả thuyết tốt nhất về đại lượng εt+1 là không và được ước lượng nhờ phần dư , phương trình dự báo có dạng: 7. San bằng số mũ đơn giản và mô hình ARIMA Giả sử α=1-ω1, thì phương trình trên tương tự như phương trình san bằng số mũ: Dự báo bằng phương pháp san bằng số mũ đơn giản, tương đương với dự báo trên cơ sở mô hình ARIMA(0,1,1) với tham số ω1=1-α. Cần lưu ý rằng, mô hình ARIMA(0,1,1) miêu tả một quá trình không dừng. Phương pháp san bằng số mũ bình thường sẽ làm việc tốt với chuỗi dữ liệu, mà có thể miêu tả phù hợp bằng mô hình ARIMA(0,1,1). Ngược lại, đối với các chuỗi thời gian không miêu tả phù hợp với mô hình ARIMA(0,1,1), thì dự báo được xây dựng bằng phương pháp san bằng số mũ là không thể đủ tốt. 7. San bằng số mũ đơn giản và mô hình ARIMA Phương pháp Box-Jenkins trong phân tích chuỗi thời gian là một công cụ rất mạnh để xây dựng dự báo chính xác với độ xa của dự báo nhỏ. Mô hình ARIMA tương đối mềm dẻo và có thể miêu tả một phạm vi rộng đặc điểm của chuỗi thời gian thường gặp trong thực tế. Các thủ tục hình thức kiểm định mô hình tương đối đơn giản và dễ tiếp cận. Ngoài ra, các dự báo và khoảng dự báo có thể thực hiện trực tiếp từ mô hình đã lựa chọn. 8. Ưu và nhược điểm của các mô hình ARIMA Nhược điểm: Cần phải có số lượng dữ liệu ban đầu đủ lớn. Khi sử dụng mô hình ARIMA, với dữ liệu không có tính mùa vụ cần phải có không ít hơn 40 quan sát. Khi xây dựng mô hình ARIMA cho dữ liệu có tính mùa vụ cần phải có số quan sát vào khoảng 6-10 năm, phụ thuộc vào số thời đoạn của mùa vụ. Không tồn tại một phương pháp đơn giản nào để điều chỉnh các tham số của mô hình ARIMA (như trong một số phương pháp san bằng số mũ) khi cập nhật dữ liệu mới. Mô hình buộc phải xây dựng lại hoàn toàn theo định kỳ, đôi khi phải chọn mô hình mới hoàn thiện hơn. Xây dựng mô hình ARIMA phù hợp thường mất nhiều thời gian và chi phí. 8. Ưu và nhược điểm của các mô hình ARIMA

Các file đính kèm theo tài liệu này:

Ch7-_PP_Box_Jenkins.ppt