BIẾN GIẢ
MỤC TIÊU
1. Biết cách đặt biến giả
2. Nắm phương pháp sử dụng
biến giả trong phân tích hồi quy
NỘI DUNG
1 Khái niệm biến giả
2 Sử dụng biến giả trong mô hình hồi quy
3 Kỹ thuật sử dụng biến giả
49 trang |
Chia sẻ: phuongt97 | Lượt xem: 586 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 5
BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY
21. Biết cách đặt biến giả
2. Nắm phương pháp sử dụng
biến giả trong phân tích hồi
quy
MỤC
TIÊU
BIẾN GIẢ
NỘI DUNG
Khái niệm biến giả1
Sử dụng biến giả trong mô hình hồi quy2
3 Kỹ thuật sử dụng biến giả
• Biến định lượng: các giá trị quan sát được thể
hệ bằng con số
• Biến định tính: thể hiện một số tính chất nào
đó
• Để đưa những thuộc tính của biến định tính
vào mô hình hồi quy, cần lượng hóa chúng =>
sử dụng biến giả (dummy variables)
4
5.1 KHÁI NIỆM
Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của
chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi
sinh sống của hộ
Mã hộ
Quy
mô hộ Chi tiêu của hộ
Trình độ
văn hóa
của chủ
hộ
Tuổi
của
chủ
hộ
Giới
tính
chủ hộ Nơi sinh sống
38820 4 10097.37 3 48 Nam Nông thôn
38818 6 14695.2 8 42 Nữ Nông thôn
38817 8 11733.34 4 37 Nữ Nông thôn
38816 3 7087.489 0 21 Nữ Nông thôn
38815 9 22809.3 6 48 Nữ Nông thôn
38813 4 9554.563 2 76 Nữ Nông thôn
11212 7 69258.09 9 42 Nữ Thành thị
11211 3 13680.91 0 77 Nữ Thành thị
11209 3 27651.65 13 32 Nữ Thành thị
11208 4 32102.67 8 47 Nữ Thành thị
11207 2 11464.6 7 38 Nam Thành thị
11206 4 17199.63 5 93 Nam Thành thị
5
Ví dụ
• Có hai biến độc lập định tính là giới tính của chủ
hộ và nơi sinh sống của hộ. Để phân tích hồi quy
cần phải lượng hóa hai biến định tính này.
• Thực hiện: Giới tính gồm hai biểu hiện là nam và
nữ và mã hóa như sau: Nam=1, Nữ=0.
• Nơi sinh sống của hộ gồm thành thị và nông thôn
nên mã hóa như sau: Thành thị=1, Nông thôn=0.
(Việc chọn số mã hóa tùy nhà phân tích).
6
Dữ liệu đã mã hóa
Mã hộ Quy mô hộ
Chi tiêu của
hộ
Trình độ văn
hóa của chủ
hộ
Tuổi của
chủ hộ
Giới tính
chủ hộ
Nơi sinh
sống
38820 4 10097.37 3 48 1 0
38818 6 14695.2 8 42 0 0
38817 8 11733.34 4 37 0 0
38816 3 7087.489 0 21 0 0
38815 9 22809.3 6 48 0 0
38813 4 9554.563 2 76 0 0
11212 7 69258.09 9 42 0 1
11211 3 13680.91 0 77 0 1
11209 3 27651.65 13 32 0 1
11208 4 32102.67 8 47 0 1
11207 2 11464.6 7 38 1 1
11206 4 17199.63 5 93 1 1
7
Ví dụ
Mã hộ Quy mô hộ
Chi tiêu
của hộ
Trình độ văn
hóa của chủ hộ
Tuổi của
chủ hộ
Nghề nghiệp
chủ hộ
38820 4 10097.37 3 48 Bác sĩ
38818 6 14695.2 8 42 Giáo viên
38817 8 11733.34 4 37 Nông dân
38816 3 7087.489 0 21 Bác sĩ
38815 9 22809.3 6 48 Giáo viên
38813 4 9554.563 2 76 Nông dân
11212 7 69258.09 9 42 Bác sĩ
11211 3 13680.91 0 77 Giáo viên
11209 3 27651.65 13 32 Nông dân
11208 4 32102.67 8 47 Bác sĩ
11207 2 11464.6 7 38 Giáo viên
11206 4 17199.63 5 93 Nông dân
8
Ví dụ
1. Nghề nghiệp có 3 nghề (3 phạm trù)
2. Chọn 1 nghề làm phạm trù cơ sở
Ví dụ: chọn bác sĩ
3. Hai nghề còn lại là hai biến mới
Vậy số biến mới = số phạm trù -1
4. Biến Giáo viên nhận 2 giá trị: 1 nếu là
giáo viên; 0 nếu không phải là giáo viên
5. Biến Nông dân nhận 2 giá trị: 1 nếu là
nông dân; 0 nếu không phải là nông dân
9
Mã hộ
Quy
mô
hộ
Chi tiêu
của hộ
Trình
độ văn
hóa
của
chủ hộ
Tuổi của
chủ hộ
Nghề
nghiệp chủ
hộ Giáo viên
Nông
dân
### 4 ### 3 48 Bác sĩ 0 0
### 6 ### 8 42 Giáo viên 1 0
### 8 ### 4 37 Nông dân 0 1
### 3 ### 0 21 Bác sĩ 0 0
### 9 ### 6 48 Giáo viên 1 0
### 4 ### 2 76 Nông dân
### 7 ### 9 42 Bác sĩ
### 3 ### 0 77 Giáo viên
### 3 ### 13 32 Nông dân
### 4 ### 8 47 Bác sĩ
### 2 ### 7 38 Giáo viên
### 4 ### 5 93 Nông dân
10
Câu hỏi
• Nếu có thêm nghề kế toán thì sao?
11
HỒI QUY VỚI BiẾN ĐỊNH TÍNH
Quy tắc: Nếu biến định tính có m biểu hiện thì
sử dụng m-1 biến.
Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào
(1) Giới tính của chủ hộ
(2) Số thành viên trong hộ
(3) Vùng nơi hộ sinh sống (có 8 vùng)
Biến định tính là biến nào?
12
13
Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui
với
Y Tiền lương (triệu đồng/tháng)
X Bậc thợ
D=1 nếu công nhân làm trong khu vực tư nhân
D=0 nếu công nhân làm trong khu vực nhà nước
D được gọi là biến giả trong mô hình
5.2 Sử dụng biến giả trong mô hình hồi quy
14
Y (thu nhập) X (số năm) D (nơi làm
việc)
4 3 1
5 5 0
3 3 0
6 4 1
7 5 1
5.2 Sử dụng biến giả trong mô hình hồi quy
15
E(Y/X,D) = 1 + 2Xi + 3Di (5.1)
E(Y/X,D=0) = 1 + 2Xi (5.2)
E(Y/X,D=1) = 1 + 2Xi + 3 (5.3)
(5.2): tiền lương trung bình của công nhân làm
việc trong khu vực quốc doanh với bậc thợ là X
(5.3): tiền lương trung bình của công nhân làm
việc trong khu vực tư nhân với bậc thợ là X
5.2 Sử dụng biến giả trong mô hình hồi quy
16
2 tốc độ tăng lương theo bậc thợ
3 chênh lệch tiền lương trung bình của công
nhân làm việc ở hai khu vực và cùng bậc thợ
(Giả thiết của mô hình: tốc độ tăng lương theo
bậc thợ ở hai khu vực giống nhau)
5.2 Sử dụng biến giả trong mô hình hồi quy
17
E(Y/X,Z) = 1 + 2Xi + 3Di
Y
1ˆ
3ˆ
31
ˆˆ
Hình 5.1 mức thu nhập bình quân tháng của người lao động tại
KVQD và KVTN khi có bậc thợ là X
X
18
Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y)
(triệu đồng/tháng) vào thời gian công tác (X)
(năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
Dùng 2 biến giả Z1 và Z2 với
Z1i =1 nơi làm việc tại DNNN
Z1i =0 nơi làm việc tại nơi khác
Z2i =1 nơi làm việc tại DNTN
Z2i =0 nơi làm việc tại nơi khác
Z1i = 0 và Z2i = 0 phạm trù cơ sở
5.2 Sử dụng biến giả trong mô hình hồi quy
19
Y (thu
nhập)
X (số
năm)
Nơi làm
việc
Z1 Z2
4 3 DNNN 1 0
5 5 DNTN 0 1
3 3 DNLD 0 0
6 4 DNTN 1
7 5 DNNN 1
5.2 Sử dụng biến giả trong mô hình hồi quy
20
E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i
E(Y/X,Z1=0,Z2=0) = 1 + 2Xi
E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3
E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4
• 3 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNNN và DNLD khi có cùng
thời gian làm việc X năm
• 4 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNTN và DNLD khi có cùng thời
gian làm việc X năm
5.2 Sử dụng biến giả trong mô hình hồi quy
21
Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ
người lao động (từ đại học trở lên, cao đẳng và
khác)
D1i =
1: nếu trình độ từ đại học trở lên
0: trường hợp khác
D2i =
1: nếu trình độ cao đẳng
0: trường hợp khác
5.2 Sử dụng biến giả trong mô hình hồi quy
Một chỉ tiêu chất lượng có n phạm trù (thuộc
tính) khác nhau thì dùng n-1 biến giả
22
5.2 Sử dụng biến giả trong mô hình hồi quy
Giả sử Y, X là biến định lượng, Z là biến giả (định tính)
TH1: Y= 1 + 2Z + 3X + U
TH2: Y= 1 + 2X + 3(ZX) + U
TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U
23
VD 5.4: Khảo sát lương của nhân viên theo
số năm kinh nghiệm và giới tính
TH1: Y= 1 + 2Z + 3X + U
TH2: Y= 1 + 2X + 3(ZX) + U
TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U
Trong đó
Y lương
X số năm kinh nghiệm
Z giới tính với Z=1: nam; Z=0: nữ
5.2 Sử dụng biến giả trong mô hình hồi quy
24
TH1: Lương khởi điểm của nv nam và nữ
khác nhau nhưng tốc độ tăng lương theo số
năm kinh nghiệm như nhau
TH2: Lương khởi điểm như nhau nhưng
tốc độ tăng lương khác nhau
TH3: Lương khởi điểm và tốc độ tăng
lương khác nhau
5.2 Sử dụng biến giả trong mô hình hồi quy
25
TH1: Lương khởi điểm của nv nam và nữ
khác nhau nhưng tốc độ tăng lương theo số
năm kinh nghiệm như nhau
Hàm PRF: Y= 1 + 2Z + 3X + U
Hàm SRF ứng với nữ (Z=0) :
Hàm SRF ứng với nam (Z=1) :
XY 31
ˆˆˆ
XY 321
ˆˆˆˆ
5.2 Sử dụng biến giả trong mô hình hồi quy
26
Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau
21
ˆˆ
0ˆ,ˆ,ˆ 321
1ˆ
0
X
Y
XY 31
ˆˆˆ
XY 321
ˆˆˆˆ
5.2 Sử dụng biến giả trong mô hình hồi quy
27
TH2: Lương khởi điểm như nhau nhưng
tốc độ tăng lương khác nhau
Hàm PRF:
Y= 1 + 2X + 3(ZX) + U
Với ZX gọi là biến tương tác
Hàm SRF ứng với nữ (Z=0) :
Hàm SRF ứng với nam (Z=1) :
XY 21
ˆˆˆ
XXXY )ˆˆ(ˆˆˆˆˆ 321321
5.2 Sử dụng biến giả trong mô hình hồi quy
28
Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác
nhau
XY 21
ˆˆˆ
0ˆ,ˆ,ˆ 321
1ˆ
0
X
Y
XY )ˆˆ(ˆˆ 321
5.2 Sử dụng biến giả trong mô hình hồi quy
29
TH3: Lương khởi điểm và tốc độ tăng lương
khác nhau
Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U
Hàm SRF ứng với nữ (Z=0) :
Hàm SRF ứng với nam (Z=1) :
XY 31
ˆˆˆ
XXXY )ˆˆ()ˆˆ(ˆˆˆˆˆ 43214321
5.2 Sử dụng biến giả trong mô hình hồi quy
30
Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau
XY 31
ˆˆˆ
21
ˆˆ
0ˆ,ˆ,ˆ,ˆ 4321
1ˆ
0
X
Y
XY )ˆˆ()ˆˆ(ˆ 4321
5.2 Sử dụng biến giả trong mô hình hồi quy
31
5.3.1 Sử dụng biến giả trong phân tích mùa
Y chi tiêu cho tiêu dùng
X thu nhập
Z = 1 nếu quan sát trong mùa (tháng 1-6)
Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12)
iii ZXY 321
ˆˆˆˆ (*)ˆˆˆˆˆ 4321 iiiii ZXZXY
5.3 Ứng dụng sử dụng biến giả
TH1: Nếu yếu tố mùa chỉ
ảnh hưởng đến hệ số
chặn
TH2: Nếu yếu tố mùa có
ảnh hưởng đến hệ số
góc
Mô hình * có tính tổng quát hơn. Qua việc kiểm định
giả thiết để biết được hệ số góc nào có ý nghĩa.
32
Ví dụ
Có bảng số liệu sau về doanh số bán từng quý
(triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến
giả và viết mô hình hồi quy.
Năm Quý Doanh số Năm Quý Doanh số
1970 1 992.7 1971 4 1918.3
1970 2 1077.6 1972 1 2163.9
1970 3 1185.9 1972 2 2417.8
1970 4 1326.4 1972 3 2631.7
1971 1 1434.2 1972 4 2957.8
1971 2 1549.2 1973 1 3069.3
1971 3 1718 1973 2 3304.8
33
Năm Quý Doanh số D2 D3 D4
1970 1 992.7 0 0 0
1970 2 1077.6 1 0 0
1970 3 1185.9 0 1 0
1970 4 1326.4 0 0 1
1971 1 1434.2 0 0 0
1971 2 1549.2 1 0 0
1971 3 1718 0 1 0
1971 4 1918.3 0 0 1
1972 1 2163.9 0 0 0
1972 2 2417.8 1 0 0
1972 3 2631.7 0 1 0
1972 4 2957.8 0 0 1
1973 1 3069.3 0 0 0
1973 2 3304.8 1 0 0
Ví dụ
34Viết mô hình hồi quy mẫu và ý nghĩa các hệ số
35
5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy
Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước
Anh từ 1946-63 (triệu pounds)
TK I Tiết kiệm Thu nhập TK II Tiết kiệm Thu nhập
1946 0.36 8.8 1955 0.59 15.5
1947 0.21 9.4 1956 0.9 16.7
1948 0.08 10 1957 0.95 17.7
1949 0.2 10.6 1958 0.82 18.6
1950 0.1 11 1959 1.04 19.7
1951 0.12 11.9 1960 1.53 21.1
1952 0.41 12.7 1961 1.94 22.8
1953 0.5 13.5 1962 1.75 23.9
1954 0.43 14.3 1963 1.99 25.2
5.3 Ứng dụng sử dụng biến giả
36
Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ
Thời kỳ tái thiết: 1946-54
(5.3.1)
Thời kỳ hậu tái thiết: 1955-63
(5.3.2)
Và kiểm định các trường hợp sau
11
22
11
22
11
22
11
22
iii UXY 121
iii UXY 221
5.3 Ứng dụng sử dụng biến giả
Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu
trúc giữa 2 thời kỳ hay không.
37
Kiểm định Chow
iii UXY 221
Giả thiết: H0: Hai hàm (5.3.1) và (5.3.2) giống nhau
B1: Gộp hai nhóm quan sát n=n1+n2 và tính RSS
có bậc tự do df= n1+n2-k từ mô hình hồi quy
B2: Ước lượng (5.3.1) và (5.3.2) và thu được
RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt
RSS*=RSS1+RSS2
B3: Tính
B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0
)2/(
/
21
*
*
knnRSS
kRSSRSS
F
38
39
40
41
iiiiii eZXZXY 4321
ˆˆˆˆ
Với n = n1 + n2
Z = 1 quan sát thuộc thời kỳ tái thiết
Z = 0 quan sát thuộc thời kỳ hậu tái thiết
B2. Kiểm định giả thiết H0: 3=0
Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình
B3. Kiểm định giả thiết H0: 4=0
Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình
5.3 Ứng dụng sử dụng biến giả
Cách 2 Sử dụng biến giả
B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ
42
43
Kết quả hồi quy theo mô hình như sau
t = (-5,27) (9,238) (3,155) (-3,109)
p = (0,000) (0,000) (0,007) (0,008)
iiiiii eZXZXY 1034,04839,115045,075,1
5.3 Ứng dụng sử dụng biến giả
Nhận xét
•Tung độ gốc chênh lệch và hệ số góc chênh lệch
có ý nghĩa thống kê
•Các hồi quy trong hai thời kỳ là khác nhau
44
Thời kỳ tái thiết: Z = 1
Thời kỳ hậu tái thiết: Z = 0
ii
iii
XY
XXY
0475,02661,0ˆ
1034,04839,115045,075,1ˆ
ii XY 15045,075,1
ˆ
5.3 Ứng dụng sử dụng biến giả
45
-0.27
-1.75
ii XY 15045,075,1
ˆ
ii XY 0475,02661,0
ˆ
Thu nhập
Tiết kiệm
Hình 5.6 Mô hình hồi quy cho 2 thời kỳ
5.3 Ứng dụng sử dụng biến giả
Thời kỳ tái thiết
Thời kỳ hậu tái thiết
46
5.3.3. Hàm tuyến tính từng khúc
Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng
sẽ khác với khi doanh thu trên X*.
Hàm hồi quy có dạng
Y Tiền hoa hồng
X Doanh thu
X* Giá trị ngưỡng sản lượng
Zi =1 nếu Xi > X*
Zi =0 nếu Xi ≤ X*
iiiii uZXXXY )(
*
321
5.3 Ứng dụng sử dụng biến giả
47
Y
X*X
Hình 5.7 Hàm tuyến tính từng khúc
5.3 Ứng dụng sử dụng biến giả
•Kiểm định giả thiết H0: 3=0
Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
48
Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng
sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:
Y: Chi phí; X: sản lượng;
X*=5.500 tấn: giá trị ngưỡng sản lượng
iiiii uZXXXY )(
*
321
*
*
1
:0
:1
XX
XX
Z
i
i
i
5.3 Ứng dụng sử dụng biến giả
49
iiiii eZXXXY )(095,0279,0717,145
*
t = (-0,824) (6,607) (1,145)
R2 = 0,9737 X* = 5500
CP 256 414 634 778 1003
SL 1000 2000 3000 4000 5000
CP 1839 2081 2423 2734 2914
SL 6000 7000 8000 9000 10000
Ta có kết quả hồi quy như sau:
5.3 Ứng dụng sử dụng biến giả
Các file đính kèm theo tài liệu này:
- bai_giang_kinh_te_luong_chuong_5_bien_gia_trong_phan_tich_ho.pdf