Phương Sai Của Sai Số Thay Đổi
Trong việc tính toán các giá trị ước lượng bình phương tối thiểu thông thường (OLS) cũng
như các giá trị ước lượng thích hợp cực đại (MLE), chúng ta đã thiết lập giả thuyết cho
rằng các số hạng sai số ui có phân phối giống nhau với trị trung bình bằng không và
phương sai σ2như nhau (Xem Giả Thuyết 3.5 của Chương 3 đã phát biểu rằng Var(ui|xt =
2σ
cho tất cả các t). Giả thuyết phương sai bằng nhau được hiểu là phương sai của sai số
không đổi (có nghĩa là phân tán như nhau). Phương sai σ2là một đại lượng đo lường mức
độ phân tán của các số hạng sai số t, xung quanh giá trị trung bình zero. Một cách tương
đương, đó là một đại lượng đo lường mức độ phân tán của giá trị biến phụ thuộc quan sát
được (Y) xung quanh đường hồi qui β1 + β2X2 + +βkXk. Phương sai của sai số không đổi
có nghĩa là mức độ phân tán như nhau cho tất cả các quan sát.
Tuy nhiên, trong nhiều trường hợp thông thường có liên quan đến những dữ liệu
chéo, giả thuyết này có thể sai. Ví dụ, giả sử như chúng ta tiến hành điều tra một mẫu
ngẫu nhiên các hộ gia đình và thu được thông tin về tổng chi phí tiêu dùng của từng hộ
gia đình và thu nhập của họ trong một năm cho trước. Những hộ gia đình với mức thu
nhập thấp không có nhiều linh động trong chi tiêu. Phần lớn thu nhập sẽ tập trung vào
các nhu cầu căn bản chẳng hạn như thức ăn, chỗ ở, quần áo, và đi lại. Do vậy, mẫu hình
chi tiêu giữa những hộ gia đình có thu nhập thấp như thế sẽ không khác nhau nhiều lắm.
Mặt khác, những gia đình giàu có có sự linh động rất lớn trong chi tiêu. Một vài gia đình
là những người tiêu dùng lớn; những người khác có thể là những người tiết kiệm nhiều và
đầu tư nhiều vào bất động sản, thị trường chứng khoán, . Điều này hàm ý rằng tiêu dùng
thực có thể khác nhiều so với mức thu nhập trung bình. Hay nói cách khác, rất có khả
năng những hộ gia đình có thu nhập cao có mức độ phân tán xung quanh giá trị tiêu dùng
trung bình lớn hơn những hộ gia đình có thu nhập thấp. Trong trường hợp như thế, biểu
đồ phân tán giữa tiêu dùng và thu nhập sẽ chỉ ra những điểm của mẫu gần với đường hồi
qui hơn cho những hộ gia đình thu nhập thấp nhưng những điểm phân tán rộng hơn cho
những hộ gia đình thu nhập cao (xem Hình 8.1). Hiện tượng như vậy được gọi là phương
sai của sai số thay đổi (có nghĩa là phân tán không như nhau). Hình 3.A.2 trong Phụ lục
Chương 3 có một đồ thị về phương sai của sai số thay đổi trong tổng thể
29 trang |
Chia sẻ: hongha80 | Lượt xem: 825 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Kinh tế lượng với các ứng dụng - Chương 8: Phương sai của sai số thay đổi, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
lượng khác nhau của mô hình. Các kết quả được tóm tắt
trong Bảng 8.3
} Bảng 8.3 Các Ước Lượng FGLS Của Mô Hình Log-Lương Sử Dụng Hồi Qui
Phụ Từ Các Kiểm Định LM
Biến Glesjer Breusch-
Pagan
White Harvey-
Godfrey
CONSTANT 3,842
(0,019)
3,869
(0,011)
3,848
(0,013)
3,828
(0,020)
YEARS 0,037
(0,003)
0,031
(0,003)
0,0369
(0,003)
0,038
(0,003)
YRS2 −4,068e-04
(7,949e-05)
−2,392e-04
(6,217e-05)
−4,514e-04
(9,481e-05)
-4,433e-04
(8,27e-05)
Adj Rsq 0,524 0,507 0,528 0,526
SGMASQ 0,043652 0,045382 0,043375* 0,043531
AIC 0,044242 0,045995 0,043961* 0,044119
FPE 0,044242 0,045995 0,043961* 0,044119
HQ 0,045071 0,046857 0,044785* 0,044946
SCHWARZ 0,046324 0,048159 0,046030* 0,046195
SHIBATA 0,044226 0,045978 0,043945* 0,044103
GCV 0,044250 0,046003 0,043969* 0,044127
RICE 0,044259 0,046012 0,043977* 0,044136
Các giá trị trong ngoặc là các sai số chuẩn tương ứng. Các dấu sao ký hiệu mô hình với tiêu chuẩn chọn
mô hình thấp nhất. Các giá trị của AIC và FPE giống nhau chỉ là tình cờ. Các giá trị này khác nhau ngoài
sáu số thập phân.
} Bảng 8.4 Các bước thực hiện trên máy tính đối với Ví dụ 8.8 về Ước lượng bằng
FGLS Sử dụng DATA8-1
1. Hồi qui ln(SALARY) theo một hằng số, YEARS và YEAR2, và chép các số dư (u^
t).
2. Phát absuhat = | u^ t|, usq = u
^
t
2, và lnusq = ln (u^ t2).
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 22
3. Hồi qui absuhat theo một hằng số, YEARS và YEARS2, và chép các giá trị
“thích hợp” thành absuhat1. Đây là σt ước lượng của đặc trựng Glesjer. May
mắn thay, tất cả các giá trị này đều dương.
4. Tính wt1 = 1/absuhat1 và dùng nó như là trọng số để có các ước lượng bình
phương tối thiểu có trọng số FGLS.
5. Đối với các đặc trưng Breusch-Pagan, hồi qui usq theo một hằng số, YEARS, và
YEARS2, và chép các giá trị “thích hợp” thành usqhat1. Đây là các giá phương
sai của sai số ước lượng. Tuy nhiên, ba quan sát có giá trị âm, là không thể chấp
nhận. Thay thế các giá trị âm này bằng các giá trị usq gốc, và gọi những giá trị
thay thế này là “usqhat2”. Một cách dễ dàng để thực hiện việc này là trước tiên
sử dụng chương trình hồi qui của bạn phát ra một biến giả, gọi là d1, biến này có
giá trị bằng 1 cho mọi giá trị dương của usqhat1 và ngoài ra sẽ bằng 0. Kế tiếp
phát usqhat2 = (d1*usqhat1) + ((1 − d1)*usq).
6. Tính wt2 = 1/sqrt(usqhat2), và sử dụng làm trọng số để có được các ước lượng
bình phương tối thiểu có trọng số FGLS (sqrt là hàm căn số bậc hai).
7. Đối với đặc trưng của kiểm định White, hồi qui usq theo một hằng số, YEARS,
YEARS2, YEARS3 và YEARS4, và chép các giá trị “thích hợp” thành usqhat3.
Đây là các phương sai của sai số ước lượng. Tuy nhiên, ở đây cũng có ba quan
sát có giá trị âm cần phải thay thế bằng các giá trị usq gốc (xem Bước 5). Gọi
chuỗi các giá trị thay thế là “usqhat4”
8. Tính wt3 = 1/sqrt(usqhat4), và sử dụng làm trọng số để có các ước lượng bình
phương tối thiểu có trọng số FGLS.
9. Đối với đặc trưng Harvey-Godfrey, hồi qui lnusq theo một hằng số, YEARS và
YEARS2, chép các giá trị “thích hợp” thành lnsq1, và lấy đối log (nghĩa là lấy
hàm mũ) để có được usqhat5, các phương sai của sai số ước lượng. Vì hàm mũ
chỉ tạo ra các giá trị dương, không có vấn đề phương sai âm ở đây.
10. Tính wt4 = 1/sqrt(usqhat5), và sử dụng làm trọng số để có được các ước lượng
bình phương tối thiểu có trọng số FGLS.
Bảng 8.4 mô tả các bước thực hiện việc này, và cần phải nghiên cứu kỹ các bước
này trước khi tiến hành.
Chúng ta thấy từ bảng 8.3 là các ước lượng mạnh một cách đáng ngạc nhiên theo
toàn bộ các phương pháp được sử dụng ở đây. Tất cả các hệ số đều có ý nghĩa thống kê
ở mức thấp hơn 0,0001. Chỉ có sự lệch duy nhất là của các ước lượng Breusch-Pagan
đối với YEARS và YEARS2. Vì R2 hiệu chỉnh và các trị thống kê lựa chọn mô hình
không có ý nghĩa đối với mô hình biến đổi có được bằng cách chia ln(SALARY) cho σ^ t,
các ước lượng này được tính bằng cách sử dụng tổng bình phương sai số của mô hình bậc
hai-log không biến đổi. Chúng ta thấy từ Bảng 8.3 là phương pháp White có các trị
thống kê chọn mô hình thấp nhất. Vì vậy, theo các tiêu chuẩn này, đây là hàm tốt nhất.
Kết quả này tái khẳng định vì chúng ta đã đề cử kiểm định White trên tất cả các kiểm
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 23
định khác vì tính tổng quát và không phụ thuộc vào giả thiết phân phối chuẩn của kiểm
định này. Sử dụng các ước lượng này, chúng ta có mô hình ước lượng sau và tác động
biên tế tương ứng của kinh nghiệm đến lương (xem lại phần thảo luận về mô hình bậc
hai trong Phần 6.4 và phần phân tích mô hình tuyến tính-logarit trong Phần 6.8):
ln(SALARY) = 3,848 + 0,0369YEARS − 0,0004514YEARS2 (8.11)
1
SALARY
∆SALARY
∆YEARS = 0,0369 − 0,0009028 YEARS (8.12)
Đặt phương trình này bằng không và giải YEARS, ta có số năm mà tại đó
SALARY sẽ đạt giá trị cực đại (chúng ta biết là đây là giá trị cực đại không phải giá
trị cực tiểu là do hệ số âm của số hạng bậc hai). Kết quả bằng 40,1 lớn hơn hầu hết
các khoảng mẫu. Vì thế, ý nghĩa là lương luôn tăng trong vòng 40 năm qua nhưng
do hệ số âm của YEARS2, nên có những lợi nhuận biên tế bị giảm. Trong Phương
trình (8.12), đặt YEARS bằng các giá trị 1, 5, 10, 15, 20 và 25, chúng ta có các con
số 0,036; 0,032; 0,028; 0,023; 0,019; 0,014. Hãy nhớ lại từ Phần 6.8, 100 nhân với
các giá trị này cho ta phần trăm tăng gần đúng của tiền lương đối với mỗi năm kinh
nghiệm nhiều hơn. Vì vậy, lương biên tế tăng hàng năm thay đổi từ một giá trị cao
là 3,6 phần trăm đối với một Tiến sĩ mới xuống 1,4 phần trăm đối với những người
có 25 năm kinh nghiệm.
Phương sai của sai số thay đổi của biến phụ thuộc
Thỉnh thoảng, độ lệch chuẩn của ut (σt) được đặc trưng như là một tỷ lệ theo giá trị
kỳ vọng của biến phụ thuộc. Bài bản hơn, giả sử σt = σE(Yt). Vì Y^ t là một ước
lượng không thiên lệch và nhất quán của E(Yt), một thủ tục được đề nghị ở đây là sử
dụng trọng số wt = 1/ Y
^
t, nghĩa là nghịch đảo của β^ 1 + β^ 2Xt2 + + β^ kXtk. Tuy nhiên
thủ tục này không được khuyên sử dụng vì ở đây cũng không có gì bảo đảm là Y
^
t
buộc phải dương với mọi giá trị t và không có một thủ tục khác để thay thế Y
^
t bằng
không hay âm. Vì E(Yt) là một hàm của các X, đây là một trường hợp đặc biệt của
hàm Glesjer được nêu trong Phương trình (8.2b), với các X được thay thế cho các Z
được sử dụng trong Phương trình đó. Vì vậy, chúng ta khuyến cáo là nên bỏ qua đặc
trưng này trong kiểm định Glesjer và các phương pháp khác để tính các trọng số.
Tuy nhiên, tốt hơn hãy áp dụng các phương pháp và xem có xuất hiện các kết quả
mạnh hay không.
} 8.4 Ứng Dụng: Một Mô Hình Của Chi Tiêu Cho Chăm Sóc Sức Khỏe Ởû Mỹ
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 24
Trong phần này, chúng ta tập trung tất cả các đề tài đã thảo luận trong chương này
và áp dụng các kỹ thuật vào một mô hình của chi tiêu cho chăm sóc sức khỏe ở Mỹ.
Tập tin DATA8-3 chứa dữ liệu chéo về thu nhập cá nhân gộp và chi tiêu cho chăm
sóc sức khỏe của 50 tiểu bang ở Mỹ và Quận Columbia (xem nguồn từ Phụ lục D).
Cả hai đều được tính bằng tỷ đôla. Cũng đã có sẵn dữ liệu về dân số Mỹ (đơn vị
hàng triệu) và phần trăm người 65 tuổi trở lên. Chúng ta đã thấy trong Ví dụ 8.7 là
biến dân số thường dẫn đến tính phương sai của sai số thay đổi và do đó thể hiện các
biến dưới dạng trên đầu người bằng cách chia cho dân số, là một cách hữu dụng để
giảm tác động này. Do đó, mô hình được thiết lập ở đây như sau:
EXPHLTH
POP = β1 + β2
INCOME
POP + β3 SENIORS + u
Chúng ta đã sử dụng các kiểm định Glesjer, Breusch-Pagan, White và Harvey-
Godfrey và đã nhận thấy giả thuyết không về tính chất phương sai của sai số không
đổi bị bác bỏ ở mức ý nghĩa thấp hơn 0,001 bằng ba kiểm định đầu tiên. Tuy nhiên,
giá trị p-value của kiểm định LM trị thống kê của kiểm định Harvey-Godfrey đối
với tính chất phương sai của sai số thay đổi bội có giá trị là 0,14, cao hơn nhiều so
với các mức chấp nhận thông thường. Do đó, chúng ta không thể bác bỏ giả thuyết
không về tính chất phương sai của sai số không đổi, ngay cả ở mức ý nghĩa 10 phần
trăm. Tuy nhiên, như chúng ta lưu ý ở Bảng 8.5, kết quả riêng phần có kèm chú
giải, hồi qui phụ đối với trường hợp này cho thấy là thu nhập đầu người và bình
phương của nó hoàn toàn có ý nghĩa. Do đó, kiểm định thứ hai được thực hiện chỉ
với những biến này, và giá trị p là 0,056. Vì giá trị này là chấp nhận được, chúng ta
áp dụng thủ tục FGLS/WLS sử dụng tất cả bốn phương pháp trên.
Bảng 8.6 tóm tắt các ước lượng và các trị thống kê liên quan. Chúng ta lưu ý là
các ước lượng Breusch-Pagan và White rất gần nhau nhưng còn các ước lượng khác
lại khác nhau. Xét về các tiêu chuẩn chọn mô hình, các ước lượng Breusch-Pagan là
tốt nhất. Cả hai hệ số của thu nhập và của thâm niên có dấu kỳ vọng là dấu dương
và có ý nghĩa cao ở mức thấp hơn 0,0001. Giữ phần trăm thâm niên không đổi, với
mức tăng $100 trong thu nhập, trung bình một khoảng chi tiêu cho sức khỏe được kỳ
vọng là $15. Đối với một mức thu nhập cho trước ở tiểu bang, một phần trăm tăng
về số năm thâm niên kỳ vọng là sẽ làm tăng chi tiêu trung bình cho chăm sóc sức
khỏe là $116.9 (vì nó được tính bằng ngàn đôla). Số đo thích hợp cho thấy là mô
hình chỉ giải thích khoảng 42 phần trăm của chi tiêu bình quân đầu người cho chăm
sóc sức khỏe. Có lẽ, việc thêm các biến phi tuyến vào sẽ làm gia tăng năng lực giải
thích. Phần này xem như bài tập cho độc giả.
Bảng 8.5 Kết Quả Riêng Phần Đối Với Ứng Dụng Trong Phần 8.4 Sử Dụng
DATA8-3
(Để tiết kiệm chỗ, các kết quả được tóm gọn trừ phi nó hữu dụng)
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 25
[Kiểm định sử dụng phương pháp Harvey-Godfrey bằng cách trước tiên hồi qui ln(u
^
t
2) theo
một hằng số, x ( = income/pop), thâm niên sq_x = x2, và sq_seniors = seniors2]
Dependent variable: ln(u ^t2)
VARIABLE COEFFICIENT STDERROR T STAT 2Prob (t>|T|)
0) Const 18.3709 13.8537 1.326 0.191364
6) X −2.2253 1.1308 −1.968 0.055130 *
4) Seniors 0.1809 0.8672 0.209 0.835647
10) Sq_x 0.0552 0.0262 2.109 0.040404 **
12) Sq_senio −0.0149 0.0357 −0.416 0.679121
Unadjusted R-squared 0.136 Adjusted R-squared 0.061
Chi-square (4): area to the right of (LM) 6.929352 = 0.139669
[Vì giá trị p-value cao, chúng ta không thể bác bỏ tính phương sai của sai số không
đổi. Tuy nhiên, vì các hệ số của x và x-bình phương là có ý nghĩa, một kiểm định
LM khác được thực hiện chỉ với những biến này]
Chi-square (2): area to the right of (LM) 5.765542 = 0.055979
[Vì giá trị p-value là chấp nhận được, chúng ta bác bỏ tính phương sai của sai số
không đổi và tiến hành với ước lượng bình phương tối thiểu có trọng số FGLS. Tóm
tắt phần thảo luận về các kết quả xem trong phần lý thuyết]
} Bảng 8.6 Các ước lượng FGLS của mô hình Chi tiêu cho sức khỏe sử dụng
các hồi qui phụ từ các kiểm định LM
Biến Glesjer Breusch-
Pagan
White Harvey-
Godfrey
CONSTANT -0.402
(0.670)
-1.588
(0.206)
-1.552
(0.195)
0.093
(0.657)
INCOME/POP 0.103
(0.028)
0.150
(0.013)
0.146
(0.013)
0.082
(0.026)
SENIORS 0.092
(0.025)
0.117
(0.015)
0.119
(0.015)
0.086
(0.026)
Adj Rsq 0.416 0.422 0.420 0.403
SGMSAQ 0.392697 0.358060* 0.359175 0.422389
AIC 0.415741 0.379071* 0.380251 0.447174
FPE 0.415797 0.379122* 0.380302 0.447235
HQ 0.434192 0.395894* 0.397126 0.467020
SCHWARZ 0.465773 0..424690* 0.426012 0.500990
SHIBATA 0.413080 0.376644* 0.377817 0.444312
GCV 0.417241 0.380439* 0.381623 0.448788
RICE 0.418877 0.381931* 0.383119 0.450548
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 26
Các số trong ngoặc là sai số chuẩn tương ứng. Dấu sao ký hiệu mô hình với tiêu chuẩn lựa chọn thấp
nhất.
} 8.5 Đề Tài Thực Nghiệm
Nếu bạn đã bắt đầu một đề tài thực nghiệm như một phần của môn học và đã tiến hành
các bước mô tả trong Phần 4.9 và 7.9, bạn có thể đã sẵn sàng để thực hiện ước lượng các
mô hình và kiểm định các giả thuyết miễn là nghiên cứu của bạn chỉ liên quan đến dữ
liệu chéo. Tuy nhiên, bạn nên cẩn thận nếu không đọc thêm những chương khác trong
cuốn sách này, phân tích của bạn sẽ bị hạn chế. Ví dụ, nếu dữ liệu của bạn là dữ liệu
chuỗi thời gian và mô hình của bạn là mô hình động có độ trễ trong hành vi, bạn nên đợi
đến khi bạn đọc hết chương 9 và 10, những chương này trình bày các vấn đề đặc biệt
liên quan đến chuỗi thời gian. Tương tự, bản chất của vấn đề mà bạn nghiên cứu có thể
xác định các tác động trở lại (xem Phần 3.10) những tác động này cần đến một mô hình
nhiều phương trình đồng thời (được trình bày trong chương 13). Nếu bạn bỏ qua vấn đề
này, các ước lượng của bạn sẽ thiên lệch và không nhất quán và các kiểm định sẽ không
có hiệu lực. Chương 12 sẽ rất quan trọng nếu bạn gặp biến phụ thuộc giả hoặc sử dụng
dữ liệu bị bỏ bớt (ví dụ chỉ có các giá trị dương được quan sát). Một cách lý tưởng, bạn
nên đọc chương 13 trước khi tiến hành ước lượng và kiểm định giả thuyết. Tuy nhiên,
nếu thời gian có hạn, bạn hãy tìm lời khuyên nơi giáo viên về các chương nào nên đọc
trước khi bắt đầu phân tích thực nghiệm.
Nếu bạn tiến hành phân tích dữ liệu chéo, hãy thiết lập một hoặc nhiều mô hình
tổng quát và ước lượng chúng. Nếu dữ liệu của bạn gồm cả dân số như một biến giải
thích, hãy diễn tả các biến dưới dạng bình quân đầu người hơn là sử dụng dân số như
một biến độc lập. Việc này tránh được các vấn đề về phương sai của sai số thay đổi có
thể có. Hãy đảm bảo tiến hành các kiểm định thích hợp đối với vấn đề phương sai của
sai số thay đổi. Nếu vấn đề này hiện diện, hãy sử dụng bình phương tối thiểu có trọng
số để có được các ước lượng hiệu quả hơn. Sau đó áp dụng kỹ thuật giản lược cơ sở dữ
liệu để loại bỏ các biến thừa khỏi mô hình.
Tóm tắt
Nếu phương sai của phần dư trong mô hình hồi qui tuyến tính là giống như trong
mọi quan sát, chúng ta có phương sai của sai số không đổi. Nếu ngược lại, phương sai
của các phần dư khác nhau trong mẫu, các sai số được xem là có phương sai của sai số
thay đổi. Nếu chúng ta bỏ qua sự hiện diện của tính chất phương sai của sai số thay đổi
và áp dụng thủ tục OLS, một số tính chất của các ước lượng bị thay đổi. Các ước lượng
OLS vẫn không lệch và nhất quán. Các dự báo căn cứ trên các ước lượng cũng không
thiên lệch và nhất quán. Tuy nhiên, các ước lượng và dự báo là không hiệu quả và do
đó sẽ không còn là BLUE. Vì các phương sai ước lượng và các đồng phương sai của các
ước lượng là thiên lệch và không nhất quán, các kiểm định giả thuyết sẽ không còn hiệu
lực nữa.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 27
Một công cụ hữu dụng để xác định tính chất phương sai của sai số thay đổi là vẽ đồ
thị bình phương của phần dư OLS (u
^
t
2) theo các biến nghi ngờ là tạo ra vấn đề phương
sai của sai số thay đổi hoặc theo các giá trị thích hợp (Y^ t2). Tuy nhiên, một kiểm định
theo thủ tục được ưa chuộng hơn.
Sự có mặt của tính chất phương sai của sai số thay đổi được xác định bằng một số
kiểm định. Kiểm định Goldfeld-Quandt gồm (1) xác định một biến có thể gây ra tính
chất phương sai của sai số thay đổi, (2) sắp xếp các quan sát theo chiều tăng dần của
biến đó, (3) ước lượng mô hình đối với n1 quan sát đầu tiên và n2 quan sát cuối cùng (n1
và n2 bằng khoảng một phần ba n), và (4) sử dụng kiểm định F về tỷ số của các phương
sai sai số ước lượng σ^ 12 và σ^ 22. Tuy nhiên, kiểm định này không được đề nghị sử dụng vì
bằng cách loại bỏ gần như một phần ba các quan sát chúng ta đã bỏ đi những thông tin
đáng giá. Tương tự, kiểm định này không ứng dụng được nếu tính chất phương sai của
sai số thay đổi phát sinh một cách liên kết bởi nhiều biến (ví dụ như dân số và thu
nhập).
Một thủ tục kiểm định được ưa chuộng là sử dụng kiểm định nhân tử Lagrange
(LM), đây là một kiểm định cỡ mẫu lớn. Trong chương này, chúng ta đã thấy bốn kiểm
định LM, mỗi kiểm định có một đặc trưng khác nhau của phương sai sai số. Kiểm định
Glesjer giả định rằng độ lệch chuẩn của sai số thứ t (σt) phụ thuộc vào một số biến (ký
hiệu là Z); kiểm định Breusch-Pagan giả định là phương sai (σt2) phụ thuộc vào các Z;
kiểm định White đặc trưng các Z bằng các biến gốc X, bình phương của chúng và tích
giữa chúng; và kiểm định Harvey-Godfrey đặc trưng logarit của phương sai [ln(σt2)] như
một hàm của các Z, tương đương với giả định là tính chất phương sai của sai số thay đổi
là gia tăng. Trong tất cả các trường hợp này, bước đàu tiên là hồi qui Y theo tất cả các
biến X, gồm cả số hạng không đổi, và có được các phần dư u
^
t. Bước tiếp theo là hồi qui
| u ^t| (đối với kiểm định Glesjer) hoặc u
^
t
2 (đối với các kiểm định Breusch-Pagan và
White), hoặc ln(u ^t2) theo các biến Z, phải gồm cả số hạng không đổi. Bước này là hồi
qui phụ trong đó số biến giải thích gồm cả số hạng không đổi được ký hiệu là p. Trị
thống kê là LM = nR2, với n là số quan sát sử dụng và R2 là R2 không hiệu chỉnh trong
hồi qui phụ. Theo giả thuyết không về tính chất phương sai của sai số không thay đổi,
LM có phân phối chi-square với p − 1 bậc tự do. Bác bỏ giả thuyết không nếu LM vượt
khỏi giá trị giới hạn χ2p –1(α), với α là mức ý nghĩa. Một cách khác, tính p-value =
Prob(χ2p - 1 > LM) – diện tích bên phải của LM trong phân phối chi-square. Nếu p-
value thấp (dưới α), chúng ta “an toàn” khi bác bỏ giả thuyết không và kết luận là có
tính chất phương sai của sai số thay đổi. Nếu p-value cao không chấp nhận được, chúng
ta không thể bác bỏ giả thuyết về phương sai của sai số không thay đổi. Trong trường
hợp này, OLS là thủ tục chấp nhận được.
Nếu tính chất phương sai của sai số thay đổi được phát hiện, người ta có thể sử dụng
bình phương tối thiểu tổng quát khả thi (FGLS), hay còn gọi là bình phương tối thiểu có
trọng số (WLS) để có được các ước lượng nhất quán và hiệu quả hơn một cách tiệm cận
(đối với các mẫu lớn) của các thông số. Thủ tục này là xác định trọng số wt cho mỗi
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 28
quan sát, bằng với nghịch đảo của độ lệch chuẩn ( 1/σt) của số hạng sai số thứ t. Vì độ
lệch chuẩn này chưa biết, chúng ta phải giả định là nó tỷ lệ với một số biến đã biết hoặc
phải sử dụng mô hình để ước lượng σt. Trong trường hợp thứ nhất, các ước lượng là
BLUE và tất cả các kiểm định có hiệu lực ngay cả đối với các mẫu nhỏ. Trong trường
hợp thứ hai, các kiểm định chỉ hiệu lực một cách tiệm cận. Thủ tục chung là sử dụng hồi
qui phụ để dự báo phương sai hoặc độ lệch chuẩn. Nếu có bất kỳ giá trị nào bằng không
hoặc âm, chúng ta sẽ thay bằng | u ^t| gốc cho ước lượng đó. Một thủ tục khác bảo đảm
các phương sai dự báo sẽ dương là hồi qui ln(u ^t2) theo các biến Z và có được các giá trị
dự báo. Phép đối log (là lấy hàm mũ) của các giá trị này sẽ luôn luôn dương và có thể
được sử dụng như là σ^ t2. Kế đến, đặt wt bằng 1/σ^ t. Sau đó nhân biến phụ thuộc và mỗi
biến độc lập, bao gồm cả số hạng không đổi (số hạng này bắt buộc phải có trong mô
hình), với wt tương ứng. Cuối cùng, hồi qui biến phụ thuộc đã biến đổi theo tất cả các
biến độc lập đã biến đổi. Phép hồi qui cuối cùng này sẽ không có số hạng không đổi.
Các ước lượng có được từ mô hình biến đổi này được gọi là ước lượng bình phương tối
thiểu tổng quát khả thi (FGLS). Đây là các ước lượng nhất quán, như là các phương sai
ước lượng và do vậy tất cả các kiểm định là hiệu lực đối với mẫu lớn. Tuy nhiên các
ước lượng này là thiên lệch đối với mẫu nhỏ.
Thuật ngữ
Auxiliary equation Phương trình phụ
Auxiliary regression Hồi qui phụ
Breusch-Pagan test Kiểm định Breusch-Pagan
Dependent variable heteroscedasticity Tính phương sai của sai số thay đổi của
biến phụ thuộc
Feasible generalized least squares
(FGLS)
Bình phương tối thiểu tổng quát khả thi
Generalized least squares (GLS) Bình phương tối thiểu tổng quát
Glesjer test Kiểm định Glesjer
Goldfrey-Quandt test Kiểm định Goldfrey-Quandt
Harvey-Godfrey test Kiểm định Harvey-Godfrey
Heteroscedasticity Phương sai của sai số thay đổi
Heteroscedasticity consistent covariance
matrix (HCCM) estimator
Ước lượng ma trận đồng phương sai nhất
quán của phương sai của sai số thay đổi
Homoscedasticity Phương sai của sai số không đổi
Jackknife Con dao xếp
Multiplicative heteroscedasticity Phương sai của sai số thay đổi bội
Park test Kiểm định Park
Weight least squares (WLS) Bình phương tối thiểu có trọng số
White’s test Kiểm định White
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004
Phương pháp phân tích
Bài đọc
Nhập môn kinh tế lượng với các ứng dụng
Chương 8: Phương sai của sai số thay đổi
Ramu Ramanathan Thục Đoan/Hào Thi 29
Các file đính kèm theo tài liệu này:
- ramach8_3064.pdf