CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN
1. HỒI QUY ĐƠN BIẾN
Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi
suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp:
62 trang |
Chia sẻ: phuongt97 | Lượt xem: 716 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Thống kê kinh tế - Nguyễn Văn Vũ An (Phần 2), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
6/11/2015
1
CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN
1. HỒI QUY ĐƠN BIẾN
Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi
suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp:
Xi 8.0 8.5 9.0 9.5 10.0 10.5 11.0 12.0 13.0 14.0
Yi 45.0 38.0 40.0 39.0 32.0 29.0 28.0 27.0 25.0 23.0
6/11/2015
2
1. HỒI QUY ĐƠN BIẾN
6/11/2015
3
1. HỒI QUY ĐƠN BIẾN
Phương trình: Yi = β1 + β2Xi + ui
Trong đó :
X, Y: Được gọi là biến. X được gọi là biến giải thích (độc
lập); Y: Biến được giải thích (phụ thuộc).
β1: Hệ số chặn, tham số chặn
β2: Hệ số góc, tham số biến
ui: Là biến ngẫu nhiên và còn gọi là yếu tố ngẫu nhiên
6/11/2015
4
2. MÔ HÌNH HỒI QUY TUYẾN TÍNH MẪU
Phương trình hồi quy mẫu: nên ta có:
Yi = + ei
ii XY
21
iY
MinXYYYe iiiii
2
21
22 )()(
222
21
)(XnX
YXnYX
XY
i
ii
6/11/2015
5
Hãy ước lượng phương trình hồi quy mẫu?
Xi Yi XY X
2
8 45 360 64
8.5 38 323 72.25
9 40 360 81
9.5 39 370.5 90.25
10 32 320 100
10.5 29 304.5 110.25
11 28 308 121
12 27 324 144
13 25 325 169
14 23 322 196
Σ105.5 Σ326 Σ3317 Σ1147.75
55,10
10
5,105
X 6,32
10
326
YTa có n =10,
5220,3
)55,10(1075,1147
6,3255,10103317
)(
2222
XnX
YXnYX
i
ii
XY
21 = 32,6 + 3,5220 x 10,55 = 69,7571
Phương trình hồi quy mẫu:
iY = 69,7571 – 3,5220Xi
6/11/2015
6
3. HỆ SỐ XÁC ĐỊNH VÀ HỆ SỐ TƯƠNG QUAN
222 )()()(
iiii YYYYYY
TSS = ESS + RSS
Xi Yi XY X
2
8 45 360 64 153.76 80.6602
8.5 38 323 72.25 29.16 52.1298
9 40 360 81 54.76 29.8018
9.5 39 370.5 90.25 40.96 13.6759
10 32 320 100 0.36 3.7524
10.5 29 304.5 110.25 12.96 0.0310
11 28 308 121 21.16 2.5119
12 27 324 144 31.36 26.0804
13 25 325 169 57.76 74.4579
14 23 322 196 92.16 147.6444
Σ105.5 Σ326 Σ3317 Σ1147.75 Σ 494.4 Σ 430.7457
8712,0
4,494
7457,4302
TSS
ESS
R
Hệ số tương quan: r = ± 2R
9334,08712,0 r
2)( YYi
2)( YYi
6/11/2015
7
4. PHƯƠNG SAI VÀ SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG
2
22
2
1
))((
)var(
XnXn
X
i
i
)var()( 11
se
22
2
2
)(
)var(
XnX i
)var()( 22
se
22
2
2
n
RSS
n
ei
6/11/2015
8
5. KHOẢNG TIN CẬY CỦA β1, β2
Khoảng tin cậy của β1: ± tα/2se( )
Khoảng tin cậy của β2: ± tα/2se( )
Ví dụ: Tiếp tục ví dụ 1, Hãy xác định khoảng tin cậy của
β1, β2.
1
1
2
2
6/11/2015
9
6. KIỂM ĐỊNH SỰ PHÙ HỢP CỦA HÀM HỒI QUY
Chúng ta kiểm định giả thuyết: H0: 2 = 0
F
R
nR
F
1118,54
8712,01
)210(8712,0
1
)2(
2
2
6/11/2015
10
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
Dự báo điểm: Cho X0, tìm thông qua phương trình hồi quy
Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu
tư là bao nhiêu?
6/11/2015
11
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
Dự báo giá trị trung bình:
Dự báo giá trị trung bình: ± t/2se( )
Ví dụ: Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu
tư trung bình là khoảng bao nhiêu ?
22
2
02
0
)(
)(1
)var(
XnX
XX
n
Y
i
)var()( 00
YYse
0Y
0Y
6/11/2015
12
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
Dự báo giá trị riêng biệt: ± t/2se
Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% hãy dự báo giá
trị riêng biệt của tổng vốn đầu tư.
)( 00
YY
0Y
22
2
02
00
)(
)(1
1)var(
XnX
XX
n
YY
i
)var()( 0000
YYYYse
6/11/2015
13
CHƯƠNG 12. HỒI QUY ĐA BIẾN
1. TỔNG QUAN VỀ MÔ HÌNH HỒI QUY ĐA BIẾN
Mô hình: Yi = β1 + β2X1t + β3X2t ++ βkXkt + ut
Trong đó :
Y là biến phụ thuộc
X là các biến độc lập
β1: Hệ số từ do
βj: Hệ số hồi quy riêng
6/11/2015
14
Các giả định (điều kiện) phân tích mô hình hồi quy đa biến
1. Tuyến tính các tham số hồi quy
2. Các giá trị mẫu của xtj được ước lượng đúng, không có sai số
3. Kỳ vọng hoặc trung bình số học của các sai số là bằng 0
4. Các sai số u độc lập với biến giải thích
5. Các sai số u có phương sai bằng nhau
6. Các sai số u từng cặp độc lập với nhau
7. Vector sai số u theo phân phối chuẩn nhiều chiều
8. Không có biến độc lập nào là hằng số, và không tồn tại các mối
liên hệ tuyến tính hoàn toàn chính xác giữa các biến độc lập
6/11/2015
15
2. PHÂN TÍCH HỒI QUY ĐA BIẾN BẰNG
PHẦN MỀM SPSS
Để phân tích hồi quy ta cần một số bước như sau:
Bước 1: Xác định vấn đề cần nghiên cứu
Bước 2: Xác định được đâu là biến Y, đâu là các biến X.
Bước 3: Lập bảng câu hỏi hoặc phiếu khảo sát để thu thập
số liệu.
Bước 4: Xử lý số liệu và nhập liệu
Bước 5: Phân tích tương quan hồi quy.
Bước 6: Báo cáo kết quả
6/11/2015
16
Ví dụ
Yi = β1 + β2X1 + β3X2 + β4X3 + β5X4 + β6X5 + β7X6 + ei
Với:
Yi: Lợi nhuận bình quân (triệu đồng)
X1: Vốn kinh doanh hiện tại (triệu đồng)
X2: Tài sản cố định (triệu đồng)
X3: Tuổi chủ nhiêm HTX (tuổi)
X4: Chuyên môn của chủ nhiệm HTX
X5: Lương của chủ nhiệm HTX (triệu đồng)
X6: Quan tâm của chính quyền địa phương đối với hoạt
động của HTX
6/11/2015
17
Kết quả chạy phần mềm SPSS
Model Summary
b
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 .898
a
.807 .662 102.83959
a. Predictors: (Constant), X6, X4, X5, X3, X2, X1
b. Dependent Variable: Y
ANOVAb
Model Sum of Squares df Mean Square F Sig.
Regression 352891.599 6 58815.267 5.561 .015
a
Residual 84607.847 8 10575.981
1
Total 437499.446 14
a. Predictors: (Constant), X6, X4, X5, X3, X2, X1
b. Dependent Variable: Y
6/11/2015
18
Kết quả chạy phần mềm SPSS
Coefficients
a
Unstandardized Coefficients
Standardized
Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
(Constant) 172.028 262.471 .655 .531 -433.231 777.287
X1 -.224 .094 -.906 -2.389 .044 -.439 -.008
X2 .335 .113 1.120 2.956 .018 .074 .597
X3 -10.728 5.579 -.398 -1.923 .091 -23.594 2.138
X4 49.052 42.833 .290 1.145 .285 -49.721 147.824
X5 185.751 60.536 .615 3.068 .015 46.154 325.348
1
X6 25.364 27.582 .173 .920 .385 -38.241 88.968
a. Dependent Variable: Y
6/11/2015
19
Kết quả dự báo bằng phần mềm SPSS
6/11/2015
20
ĐA CỘNG TUYẾN
1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Đa cộng tuyến là sự tồn tại mối quan hệ tuyến tính “hoàn
hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải
thích trong một mô hình hồi quy.
6/11/2015
21
2. HẬU QUẢ CỦA ĐA CỘNG TUYẾN
Không xác định được hệ số quan hệ
Độ lệch chuẩn của hệ số hồi quy ước lượng sẽ rất lớn.
Điều này có nghĩa là ước lượng của chúng ta kém chính
xác và khoảng tin cậy sẽ rộng hơn
Khi độ lệch chuẩn của hệ số hồi quy ước lượng lớn, giá trị
t-test thường nhỏ nhưng mô hình lại thường có R2 cao nên
ta dễ đưa ra các quyết định sai lầm về độ tốt của mô hình
hồi quy
Ước lượng hệ số hồi quy sẽ dễ bị thay đổi khi ta bỏ một
vài quan sát hay bỏ một biến độc lập được cho là không có
giá trị.
6/11/2015
22
3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA
CỘNG TUYẾN
Cách 1: Một cách đơn giản để xác định đa cộng tuyến là ta
tính hệ số tương quan giữa các cặp biến độc lập. Nếu ta thấy
hệ số tương quan trên 0,8, ta có thể coi đó là quan hệ gần
như hoàn hảo. Nếu ta thấy hệ số tương quan trên 0,5, ta có
thể coi đó là quan hệ chặt chẽ
6/11/2015
23
3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN
Cách 2: Sử dụng yếu tố phóng đại phương sai (VIF): Nếu
VIF > 10 thì xảy ra hiện tượng đa cộng tuyến.
Coefficients
a
Model
Unstandardized Coefficients Standardized Coefficients
t Sig.
Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 3.348 .466 7.186 .000
I -.073 .037 -.086 -1.989 .070 .252 3.962
W .208 .008 1.071 24.796 .000 .252 3.962
a. Dependent Variable: C
6/11/2015
24
4. CÁCH KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
Thu thập thêm dữ liệu hoặc thu thập dữ liệu chính xác hơn
Tái cấu trúc mô hình bằng cách đưa thêm thông tin bổ trợ
vào
Xác định cặp biến độc lập nào có quan hệ gần hoàn hảo,
ta có thể bỏ bớt một biến độc lập. Tính R2 đối với các hàm
hồi quy: có mặt cả hai biến; không có mặt một trong hai
biến. Ta loại biến mà giá trị R2 tính được khi không có mặt
biến đó là lớn hơn
6/11/2015
25
PHƯƠNG SAI SAI SỐ THAY ĐỔI VÀ HẬU QUẢ
1. TỔNG QUAN VỀ PHƯƠNG SAI SAI SỐ THAY ĐỔI
6/11/2015
26
2. HẬU QUẢ CỦA PHƯƠNG SAI SAI SỐ THAY ĐỔI
Ước lượng OLS vẫn tuyến tính, chúng vẫn là ước lượng
không chệch. Tuy nhiên, chúng sẽ không còn có phương
sai nhỏ nhất nữa
Công thức thông thường để ước lượng phương sai của ước
lượng OLS, nhìn chung, sẽ chệch
Theo đó, các khoảng tin cậy và kiểm định giả thuyết thông
thường dựa trên phân phối t và F sẽ không còn đáng tin
cậy nữa
6/11/2015
27
CÁCH PHÁT HIỆN VÀ KHẮC PHỤC PHƯƠNG SAI
SAI SỐ THAY ĐỔI
1. CÁCH PHÁT HIỆN PHƯƠNG SAI SAI SỐ THAY ĐỔI
1.1. Xem xét đồ thị của phần sai số
6/11/2015
28
1.2. Kiểm định Park
Park cho rằng i
2 là một hàm số nào đó của biến giải thích
X. Trong trường hợp mô hình hai biến, Park đã đưa ra dạng
hàm số giữa i
2 và X như sau:
lni
2 = 1 + 2lnXi + vi (1)
Park đã đề nghị chúng ta có thể sử dụng ei thay cho i và
chạy mô hình hồi quy sau:
lnei
2 = 1 + 2lnXi + vi (2)
ei
2 có thể được thu thập từ mô hình hồi quy gốc. Theo đó,
kiểm định Park được tiến hành theo các bước sau đây:
6/11/2015
29
1.2. Kiểm định Park
6/11/2015
30
1.3. Kiểm định Glejser
6/11/2015
31
1.4. Kiểm định tương quan hạng của Spearman
6/11/2015
32
1.4. Kiểm định tương quan hạng của Spearman
6/11/2015
33
Kết quả phát hiện PSSSTĐ bằng SPSS
H0: Hệ số tương quan hạng của tổng thể bằng 0
Nhìn vào giá trị sig. của kiểm định là 0,489 > mức ý nghĩa
= 5% Chấp nhận giả thuyết H0, tức là mô hình không
xảy ra hiện tượng phương sai sai số thay đổi.
Correlations
Lai suat ABSres
Correlation Coefficient 1.000 -.248
Sig. (2-tailed) . .489
Lai suat
N 10 10
Correlation Coefficient -.248 1.000
Sig. (2-tailed) .489 .
Spearman's rho
ABSres
N 10 10
6/11/2015
34
1.5. Kiểm định Goldfeld – Quandt
6/11/2015
35
1.5. Kiểm định Goldfeld – Quandt
Bước 3: Sử dụng phương pháp bình phương bé nhất để ước lượng tham số của các
hàm hồi quy đối với 2
cn
quan sát đầu và cuối; thu thập tổng bình phương của các
phần dư RSS1 và RSS2 tương ứng. Trong đó RSS1 đại diện cho RSS từ hồi quy ứng
với các giá trị của Xi nhỏ hơn và RSS2 ứng với các giá trị Xi lớn hơn. Bậc tự do
tương ứng là 2
cn
- k hoặc
2
2kcn
. Trong đó, k là các tham số được ước lượng
kể cả hệ số chặn.
6/11/2015
36
1.5. Kiểm định Goldfeld – Quandt
Bước 4: Tính tỷ số
dfRSS
dfRSS
/
/
1
2
Nếu ui theo phân phối chuẩn và nếu giả định về phương sai có điều kiện không đổi
được thỏa mãn thì λ tuân theo phân phối F với bậc tự do ở tử số và mẫu số là
2
2kcn
.
Khi thực hành, nếu λ tính được lớn hơn giá trị tra bảng F ở mức ý nghĩa mong
muốn, thì chúng ta có thể bác bỏ giả thuyết H0: phương sai có điều kiện không
đổi, nghĩa là chúng ta có thể nói phương sai của sai số thay đổi.
6/11/2015
37
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
6/11/2015
38
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
2.2. Trường hợp chưa biết i
2
Trường hợp 1: Phương sai sai số tỷ lệ với bình phương biến giải thích:
E(ui
2) = 2 Xi
2
Trong đó, hằng số i
2 là nhân tố tỷ lệ.
Chia 2 vế mô hỉnh (13) cho Xi:
i
i v
XX
u
XX
2
i
1
i
2
i
1
i
i 1
Y
(15). Tương tự như trường hợp đã
biết i
2 trên, chúng ta có thể dễ dàng chứng minh phần dư vi này là đồng
đều và chúng ta có thể áp dụng phương pháp WLS để ước lượng
(15) như phần trước.
6/11/2015
39
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
Trường hợp 2: Phương sai sai số tỷ lệ với biến giải thích: E(ui
2) = 2 Xi.
Chia 2 vế mô hỉnh (13) cho iX :
i
i vX
XX
u
X
XX
i2
i
1
i
i2
i
1
i
i 1
Y
(16)
Trong đó vi =
iX
ui và có thể thấy ngay rằng E(vi
2) = 2
6/11/2015
40
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
Trường hợp 3: Phương sai của sai số tỷ lệ với bình phương của giá trị kỳ vọng
của Y. Điều này nghĩa là: E(ui
2) = 2[E(Yi)]
2 . Trong trường hợp này, chúng ta
thực hiện việc biến đổi như sau:
ii
iii
i
i
iii
vX
YEYEYE
u
X
YEYEYE )(
1
)(
1
)()()(
)(
Y
21
21i
(17)
Trong đó vi =
)( i
i
YE
u
, var(vi) =
2
6/11/2015
41
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
Bước 1: Ước lượng mô hình hồi quy Yi = β1 + β2Xi + ui bằng phương pháp OLS
thông thường, từ đó ta thu được
iY . Sau đó, sử dụng
iY để biến đổi mô hình gốc
về dạng như sau:
i
i
i
ii
v
Y
X
YY
21
i 1
Y
(18) Trong đó, vi =
i
i
Y
u
Bước 2: Ước lượng hồi quy (18), dù
iY không chính xác là E(Yi), nhưng chúng là
ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Yi). Do
vậy, phép biến đổi (18) có thể dùng được khi cỡ mẫu tương đối lớn.
6/11/2015
42
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
Trường hợp 4: Phép biến đổi loga
Đôi khi thay vì dự đoán về i
2, chúng ta có thể định lại dạng của mô hình để làm
giảm ảnh hưởng của phương sai sai số không đồng nhất. Chẳng hạn, thay vì ước
lượng mô hình hồi quy gốc (13), ta có thể ước lượng mô hình hồi quy:
lnYi = β1 + β2lnXi + ui (19)
6/11/2015
43
HIỆN TƯỢNG TỰ TƯƠNG QUAN
1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN
Thuật ngữ tự tương quan có thể được định nghĩa như là
“quan hệ tương quan giữa các thành viên của chuỗi của
các quan sát được sắp xếp theo thời gian [như trong dữ
liệu chuỗi thời gian] hoặc không gian [như trong dữ liệu
chéo].”
6/11/2015
44
1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN
Hình 1: Các dạng phân phối của sai số ui hoặc (ei)
6/11/2015
45
*Nguyên nhân của sự tự tương quan
Tính ì
Hiện tượng mạng nhện
Các độ trễ
Xử lí số liệu
Một cách xử lý khác là phép nội suy và ngoại suy số liệu
Sai lệch do lập mô hình
6/11/2015
46
2. HẬU QUẢ CỦA TỰ TƯƠNG QUAN
Ước lượng hệ số hồi quy vẫn là ước lượng không thiên
lệch, nhưng không còn là ước lượng hiệu quả nhất
Công thức ta dùng để tính phương sai ở các chương trước
không thể áp dụng trong trừơng hợp này. Do đó, kiểm
định giả thuyết, tính khoảng tin cậy, khoảng dự báo sẽ sai.
6/11/2015
47
CÁCH PHÁT HIỆN VÀ KHẮC PHỤC TỰ TƯƠNG QUAN
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
6/11/2015
48
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
6/11/2015
49
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
6/11/2015
50
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
Model Summary
b
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 .927a .859 .855 11.17237 .234
Tra bảng Durbin-Watson, ở mức ý nghĩa α = 5%, dL= 1,393 và dU = 1,514. Theo kết
quả chạy mô hình 0 < d = 0,234 < dL nên mô hình xảy ra hiện tượng tự tương quan
dương.
6/11/2015
51
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
2.1. Trường hợp đã biết cấu trúc của tự tương quan
Giả sử yếu tố nhiễu ui có tự tương quan bậc 1, nghĩa là:
ut = ρut-1 + et (1)
Trong đó < 1 và et thoả mãn các giả định của phương pháp OLS. Giả sử (1) là
đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tương
quan ρ đã biết. Để làm sáng tỏ vấn đề này, ta xét mô hình hai biến:
Yt = β1 + β2Xt + ut (2)
Nếu (2) đúng với t thì cũng đúng với t – 1 nên: Yt-1 = β1 + β2Xt-1 + ut-1 (3)
Nhân 2 vế phương trình (3) cho ρ, ta được: ρYt-1 = ρβ1 + ρβ2Xt-1 + ρut-1 (4)
6/11/2015
52
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
6/11/2015
53
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
6/11/2015
54
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
Phương pháp Durbin-Watson hai bước để ước lượng ρ
Để minh hoạ phương pháp này, chúng ta viết lại phương trình sai phân tổng quát dưới dạng
sau: Yt = β1(1- ρ) + β2Xt - ρ β2Xt-1 + ρYt-1 + et (5)
Durbin đã đề xuất thủ tục 2 bước như sau để ước lượng ρ:
Bước 1: Coi (5) như một mô hình hồi quy đa biến, hồi quy Yt theo Xt, Xt-1, Yt-1 và
giá trị ước lượng được của các hệ số hồi quy của Yt-1 là giá trị ước lượng của ρ. Mặc
dầu là ước lượng chệch nhưng ta có ước lượng vững của ρ.
Bước 2: Sau khi ước lượng được
, hãy đổi biến Yt
* = Yt -
Yt-1 , Xt
* = Xt -
Xt-1
Và ước lượng hồi quy Yt
* = β1
*
+ β2
*Xt
* + et bằng phương pháp bình phương nhỏ
nhất thông thường.
6/11/2015
55
BIẾN GIẢ VÀ CÁCH XÁC ĐỊNH MÔ HÌNH HỒI QUY
CÓ SỰ XUẤT HIỆN CỦA BIẾN GIẢ
1. TỔNG QUAN VỀ BIẾN GIẢ
Trong nhiều tình huống, cùng với các biến định lượng còn
có những biến định tính. Ví dụ khi nghiên cứu tiêu dùng
của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có
thể định lượng được, nhưng giới tính của chủ hộ, cấu trúc
thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách của
chính phủ là các biến không định lượng được.
6/11/2015
56
2. KỸ THUẬT BIẾN GIẢ
2.1. Hồi quy với biến giải thích là biến định tính
2.1.1. Biến định tính có hai phạm trù
VD: Thu nhập có phụ thuộc giới tính ?
Yi : thu nhập
Di =
0
1
Nếu quan sát là Nam
Nếu quan sát là Nữ
Mô hình : Yi = 1 + 2Di + ui
Thu nhập trung bình của nam E(Y/Di = 1) = 1 + 2
Thu nhập trung bình của nữ E(Y/Di = 0) = 1
Nếu 2 0 thì thu nhập trung bình có phụ thuộc giới tính
Biến D dùng như trên gọi là biến giả.
6/11/2015
57
2. KỸ THUẬT BIẾN GIẢ
Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm.
STT
Lương
(Y: nghìn $)
Giới D
1 22 Nam 1
2 19 Nữ 0
3 18 Nữ 0
4 21,7 Nam 1
5 18,5 Nữ 0
6 21 Nam 1
7 20,5 Nam 1
8 17 Nữ 0
9 17,5 Nữ 0
10 21,2 Nam 1
Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei
6/11/2015
58
Quy tắc đặt biến giả
Biến giả chỉ nhận giá trị 0 và 1
Cá thể nào cũng phải có giá trị
Biến giả chia tổng thể thành những thành phần riêng biệt
6/11/2015
59
2.1. Hồi quy với biến giải thích là biến định tính
1.1.2. Biến định tính có k phạm trù
Lúc đó dùng k-1 biến giả để thay thế cho chúng.
Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn?
Yi: Chi phí cho văn hoá phẩm.
D2i = 1: Trình độ tiểu học
0: Trình độ khác
D3i = 1: Trình độ trung học
0: Trình độ khác
D4i = 1: Trình độ đại học
0: Trình độ khác
Mô hình có dạng:
Yi = 1 + 2D2i + 3D3i + 4D4i + ui
6/11/2015
60
2.1. Hồi quy với biến giải thích là biến định tính
2.1.3. Mô hình có hai biến định tính
Ví dụ: Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, giữa nam và
nữ?
D2 =
0
1
Nếu là nam
Nếu là nữ
D3 =
0
1
Nếu làm việc ở thành thị
Nếu làm việc ở nông thôn
E(Y/D2i, D3i) = 1 + 2D2i + 3D3i + ui
Các chú ý:
Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n1,
n2, . . . nk thì phải dùng k – 1 biến giả.
Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùng để so sánh với các
phạm trù khác.
Các hệ số góc riêng phần được gọi là các hệ số chênh lệch.
Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như
thông lệ.
6/11/2015
61
2.1. Hồi quy với biến giải thích là biến định tính
2.1.4. Sự tương tác giữa các biến giả
Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng.
Để tính đến điều đó ta thêm vào mô hình biến tương tác.
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Mô hình 1:
Yi = 1 + 2D2i + 3D3i + 5Xi + ui
Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác.
Mô hình 2:
Yi = 1 + 2D2i + 3D3i + 4D2i*D3i + 5Xi + ui
Kiểm định H0: 4 = 0 (không có tương tác)
H1: 4 0 (có tương tác)
Lúc đó mức độ tương tác bằng 4.
6/11/2015
62
2.2. Dùng biến giả để phân tích biến động mùa vụ
Xét mô hình: Yi = 1 + 2Xi + ui
Nếu có sự biến động mùa vụ, chẳng hạn theo quý thì dùng 3 biến giả để đặc
trưng cho chúng:
D2 = 1: Quý II
0: Quý khác
D3 = 1: Quý III
0: Quý khác
D4 = 1: Quý II
0: Quý khác
Ta có mô hình: Yi = 1 + 2D2i + 3D3i + 4D4i + 5Xi + ui
Như vậy phạm trù cơ sở là quý I, nếu có ảnh hưởng theo mùa của từng quý khác
nhau thì các hệ số 2, 3, 4 khác nhau có ý nghĩa thống kê.
Các file đính kèm theo tài liệu này:
- bai_giang_thong_ke_kinh_te_nguyen_van_vu_an_phan_2.pdf