Mô hình ARMA cho các dãy sốcân bằng
Mô hình AR và các tính chấtcủamôhình
Mô hình MA và tính chấtcủamôhình
Là mô hình mà ta dựđoán giá trịtương lai củamô
hình dựatrêncácgiátrịquá khứcủadãy số
Sửdung đểdựbáo ngắnhạn
Khôngcótínhlýthuyết, không giống mô hình cấu
trúc (structural models)
30 trang |
Chia sẻ: Mr Hưng | Lượt xem: 1132 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Toán học - Dự báo chuỗi thời gian sử dụng mô hình ARMA và ARIMA, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Economics 20 - Prof. Anderson 1
Dự báo chuỗi thời gian sử dụng
mô hình ARMA và ARIMA
Nguyễn Ngọc Anh
Trung tâm Nghiên cứu Chính sách và Phát triển
Nguyễn Việt Cường
Đại học Kinh tế Quốc dân
Economics 20 - Prof. Anderson 2
Mô hình chuỗi thời gian đơn
(Univariate time series models)
Mô hình ARMA cho các dãy số cân bằng
Mô hình AR và các tính chất của mô hình
Mô hình MA và tính chất của mô hình
Là mô hình mà ta dự đoán giá trị tương lai của mô
hình dựa trên các giá trị quá khứ của dãy số
Sử dung để dự báo ngắn hạn
Không có tính lý thuyết, không giống mô hình cấu
trúc (structural models)
Economics 20 - Prof. Anderson 3
Phương pháp Box Jenkins
Box and Jenkins (1970) là những người đầu
tiên thực hiện việc ước lượng mô hình
ARMA một cách có hệ thống: Gồm 3
1. Xây dựng/xác định mô hình -
Identification
2. Ước lượng Estimation
3. Kiểm định mô hình - Model
diagnostic checking
Economics 20 - Prof. Anderson 4
Phương pháp Box Jenkins
Bước 1: Xây dựng mô
Kiểm định nghiệm đơn vị, xem xem có
cần lấy sai phân số liệu hay
Xác định bậc p và q
Economics 20 - Prof. Anderson 5
Phương pháp Box Jenkins
Bước 2:
Ước lượng các tham số của mô hình
Việc ước lượng có thể được thực hiện bằng
phương pháp khả năng cực đại hoặc, bình
phương cực tiểu phi tuyến
Bước 3: Kiểm định
Kiểm định dựa trên phần dư của mô hình
Economics 20 - Prof. Anderson 6
Dãy số nhiễu trắng
Nếu dãy số thời gian εt là nhiễu trắng ta có
vơi mọi t:
0sfor0)ε,ε(Cov
σ)ε(Var
0)ε(E
stt
2
t
t
≠=
=
=
−
Economics 20 - Prof. Anderson 7
Chỉ xét các dãy số cân bằng
Xem các phần bài giảng trước về định nghĩa của
một dãy số cân bằng
Hai yếu tố cơ bản để xây dưng mô hình ARMA và
để dự báo là:
Hàm tự tương quan của mẫu (sample
autocorrelation function - ACF)
Hàm tự tương quan một phần của mẫu (sample
partial autocorrelation function - PACF)
Economics 20 - Prof. Anderson 8
Hàm số tự tương quan của mẫu (SAMPLE
AUTOCORRELATION FUNCTION) (còn được gọi là
correlogram)
( ) ( ) ,...2,1,0k
)Y(raˆV)Y(raˆV
Y,YvoˆCrY,YrroˆC
ktt
ktt
kktt ±±===
−
−
−
Chúng ta muốn ước lượng rk với k=1,2,3,
Có thể làm điều này một cách dễ dàng trong STATA với lệnh
AC
Economics 20 - Prof. Anderson 90 5 10
-0.75
-0.50
-0.25
0.00
0.25
0.50
0.75
1.00
ACF-u
Hàm ACF của dãy nhiễu trắng (400 quan sát lấy từ
phân phối chuẩn N(0,1) )
Economics 20 - Prof. Anderson 10
Hàm tự tương quan một phần của mẫu (sample
partial autocorrelation function - PAC)
The kth order estimated or sample PAC coefficient,
denoted here , is obtained as the parameter
estimate of in the kth order autoregression
kkφˆ
kφ
tktk2t21t10t εYφ...YφYφφY +++++= −−−
Economics 20 - Prof. Anderson 110 5 10
-0.75
-0.50
-0.25
0.00
0.25
0.50
0.75
1.00
PACF-u Hàm PACF của mẫu của một dãy
nhiễu trắng
Economics 20 - Prof. Anderson 12
Dãy số tự qui (autoregressive processes)
Nếu Y là một dãy số tự qui bậc nhất AR (1), thì sẽ có dạng
)σ NID(0, ~ ε
T1,...,= t, ε + Yφ + φ = Y
2
t
t1-t10t
Economics 20 - Prof. Anderson 13
Dãy số tự qui (autoregressive processes)
Nếu Y là một dãy số tự qui bậc p AR (p), thì sẽ có dạng
)σ NID(0, ~ ε
T1,...,= t, ε + Yφ + ... + Yφ + φ = Y
2
t
tp-tp1-t10t
Economics 20 - Prof. Anderson 140 50 100 150 200 250 300 350 400
0
1
2
3
4
5
6
7
8 Y2 Y2 an AR(1) series:
Y2t = 2 +0.5Y2t-1 + εt
Economics 20 - Prof. Anderson 15
Dãy số trung bình trượt MA (1)
Nếu Y là một dãy số trung bình trượt bậc nhất MA (1), thì Y sẽ có dạng
εθ+ε+γ=Y 1-t1tt
Dãy MA (q)
Nếu Y là một dãy trung bình trượt bậc q thì Y sẽ có dạng
εθεθεθεγ q-tq2-t21-t1tt +... +++ + = Y
Economics 20 - Prof. Anderson 160 50 100 150 200 250 300 350 400
-1
0
1
2
3
4
5
Y1 An MA(2) process
Economics 20 - Prof. Anderson 17
Dãy số ARMA
Y là một dãy số ARMA (p,q) :
qtq1t1tptp1t1t εθ...εθεYφ...YφαY −−−− +++++++=
Economics 20 - Prof. Anderson 18
Một dãy số/mô hình ARMA(p,q) nếu lựa chọn được bậc p và q
phù hợp, có thể mô phỏng (mimic) bất kỳ một dãy số thời gian
nào
Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta
có thể:
• Tìm được giá trị phù hợp của p và q (xác định mô hình), và
• Ước lượng được các tham số của mô hình ARMA model sử
dụng các thong tin trong quá khứ của Yt (ước lượng mô
hình)
Thì chúng ta có thể sử dụng mô hình ARMA để dự báo các giá
trị trong tương lai của Yt.
Economics 20 - Prof. Anderson 19
Dãy số tự qui và hàm số tự tương quan (ACF)và hàm
tương quan một phần (PACF)
Với một dãy số AR(p) thuần túy ta có:
Hàm số tự tương quan (ACF) có xu hướng giảm dần khi k
tăng lên
Hàm số tự tương quan một phần (PACF) sẽ có xu hướng
Cho ta biết một điểm cắt (a cut off point), điểm cắt này
tương ứng với việc hàm số tự tương quan một phần sẽ khác 0 v
các k ≤ p, nhưng sẽ bằng 0 (xấp xỉ) với k>p.
Economics 20 - Prof. Anderson 20
0 5 10
-0.5
0.0
0.5
1.0
ACF-Y2
0 5 10
-0.5
0.0
0.5
1.0
PACF-Y2
Y2, an AR(1) series
Economics 20 - Prof. Anderson 21
Dãy số MA và hàm tự tương quan (ACF) và hàm tự
tương quan một phần PACF
Khi ước lượng các hàm ACF và PACF, thì chúng có các đặc điểm sau để
phân biệt đối với dãy số MA (q) thuần túy
• Hàm ACF có điểm cắt (cut-off point) là điểm mà hệ số tự tương quan rk
có giá trị xấp xỉ bằng không, với mọi k>q
• Hàm PACF có xu hướng giảm dần khi k tăng lên
Economics 20 - Prof. Anderson 22
0 5 10
-0.5
0.0
0.5
1.0
ACF-Y1
0 5 10
-0.5
0.0
0.5
1.0
PACF-Y1
MA(2) series
Economics 20 - Prof. Anderson 23
Một số điểm lưu ý
1: Với mô hình MA(q), ACFq+1 = ACFq+2 = =
0.
2: Với mô hình AR(q), PACFp+1 = PACFp+2 =
= 0.
3: Nhiễu trắng, ACF1 = ACF2 = = PACF1 =
PACF2 = = 0.
Economics 20 - Prof. Anderson 24
Mô hình ACF PACF
Nhiễu trắng Tất cả đều bằng 0 Tất cả đều bằng 0
MA(1) Bằng 0 sau 1 bước trễ Giảm dần từ bước trễ thứ 1
MA(2) Bằng 0 sau 2 bước trễ Giảm dần từ bước trễ thứ 2
MA(q) Bằng 0 sau q bước trễ Giảm dần từ bước trễ thứ q
AR(1) Giảm theo cấp số nhân (geometric) tình từ
bước trễ thứ 1
Bằng 0 sau 1 bước trễ
AR(2) Giảm theo cấp số nhân (geometric) tình từ
bước trễ thứ 2
Bằng 0 sau 2 bước trễ
AR(p) Giảm theo cấp số nhân (geometric) tình từ
bước trễ thứ p
Bằng 0 sau p bước trễ
ARMA(1,1) Giảm theo cấp số nhân (geometric) tình từ
bước trễ thứ 1
Giảm từ bước trễ thứ 1
ARMA(p,q) Giảm theo cấp số nhân (geometric) tình từ
bước trễ thứ p
Giảm từ bước trễ thứ q
Đặc điểm của mô hình ARMA
Economics 20 - Prof. Anderson 25
Kiểm định tự tương quan
Để kiểm định giả thuyết dưới dạng
0 :Hvói 0 = :H kak0 ≠ρρ
Chúng ta sử dụng hệ số ước lượng tự tương quan, rk, để làm xấp xỉ thay cho
(proxies) hệ số tự tương quan thật (true autocorrelation coefficients) và sử
dụng hàm phân phối xấp xỉ nếu giả thuyết trống là đúng là:
)
T
1 0, N(~ rk
Như vậy, khoảng tin cậy 95% có thể được xây dựng như sau
T
2 rk ±
Economics 20 - Prof. Anderson 26
Kiểm định tự tương quan từng phần
Để kiểm định xem liệu các hệ số tự tương quan từng phần (PAC) ở một độ trễ
nào có có khác 0 về mặt thống kê hay không, chúng ta có thể thực hiện như
sau. Gọi kkφ là hệ số tương quan từng phần ở bậc k và kkφˆ là ước lượng
dựa trên mẫu. Chúng ta muốn kiểm định giả thuyết sau
0 φ :H vs0 = φ :H kkakk0 ≠
Chúng ta sử dụng hệ số ước lượng của hệ số tương quan từng phần dựa trên
mẫu để thay thế cho tham só thực và sử dụng hàm phân phối xấp xỉ (với điều
kiện là giả thuyết trông đúng)
)
T
1 0, N(~ φkk
Nhu vậy chúng ta có thể xây dựng được khoảng tin cậy 95% để sử dụng cho
việc kiểm định như sau
T
2 φˆkk ±
Economics 20 - Prof. Anderson 27
Các bước tiếp theo của phương pháp BOX JENKINS
Có 2 bước tiếp theo cần thực hiện:
1. Ước lượng các tham số của mô hình ARMA cho biến Y
2. Tiến hành dự báo (động – dynamic forecast)đối với Y dựa trên mô
hình ARMA vừa ước lượng được.
Dự báo động có thể được tiến hành theo phương pháp đệ qui
(recursively).
δ + εθ + εθ + ε+ Yφ + Yφ = Y 1-T2T11+T1-T2T11+T
Dự báo một kỳ tiếp theo (one step/period ahead forecast) chính là kỳ
vọng toán có điều kiện của YT+1 dựa trên số liệu quá khứ Y (conditional
upon the past history of Y), và có dạng như sau
δˆ + εˆθˆ + εˆθˆ + Yφˆ + Yφˆ = Yˆ 1-T2T11-T2T11+T
Economics 20 - Prof. Anderson 28
Chúng ta biết một mô hình ARMA(p,q) nếu chọn được bậc p và q thích hợp có
thể mô tả bất kỳ dãy số thời gian nào
Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể:
• Tìm được giá trị phù hợp của p và q (xác định mô hình), và
• Ước lượng được các tham số của mô hình ARMA model sử dụng các thong
tin trong quá khứ của Yt (ước lượng mô hình)
Thì sau đó chúng ta có thể sử dụng mô hình ARMA vừa ước lượng để dự báo
giá trị của Yt trong tương lai.
Mục tiêu của chúng ta là dự báo Y trong k giai đoạn trong tương lai. Gọi T là kỳ
hiện tại, và gọi $YT+1 là giá trị dự báo của kỳ kế tiếp, và $YT i+ là giá trị dự báo của
kỳ T+i trong tương lai, i có thể nhận giá trị từ 1 tới k (i = 1, ...k).
Economics 20 - Prof. Anderson 29
Giá trị dự báo của kỳ thứ 2, YT+2 , là
δˆ + εˆθˆ + Yφˆ + Yˆφˆ = Yˆ T2T21+T12+T
Trong biểu thức này, ta sử dụng số dự báo của kỳ trước YT+1 làm biến giải
thích
Economics 20 - Prof. Anderson 30
Dãy số thời gian không cân bằng: Mô hình ARIMA
Nếu dãy số Y không cân bằng, thì ta sẽ xử lý như thế nào?
Lời giải: Biến đổi số liệu để dãy số trở nên cân bằng.
Phương pháp hay dung là lấy sai phân cho đến khi
dãy số cân bằng
(Thường thì chỉ cần sai phân 1-2 lần là dãy số cân bằng)
Gọi dãy số đã sai phân này là biến Z.
Sau đó ước lượng mô hình ARMA và dự báo với biến Z.
Cuối cùng, tiến hành tích hợp (integrate – reverse the process) c
báo Z để thu được ước lượng của Y
Các file đính kèm theo tài liệu này:
- day_9_forecasting_time_series_with_arma_and_arima_models_7043.pdf