Là một công cụ quan trọng nhấtcủacácnhà
nghiên cứukinhtế
Hồiqui làphương pháp mô tảvàđánh giá mối
quan hệ giữamộtbiến(gọilàbiếnphụthuộc,
thường ký hiệulày) vớimộthay nhiềubiến khác
(gọilàbiếnđộclập, x
59 trang |
Chia sẻ: Mr Hưng | Lượt xem: 800 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Lý thuyết tổ hợp - Mô hình hồi qui đơn giản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Economics 20 - Prof. Anderson 1
Mô hình hồi qui đơn giản
y = β0 + β1x + u
Economics 20 - Prof. Anderson 2
Dự báo sử dụng mô hình chuỗi thời
gian
(Time Series Models for Forecasting)
Ôn tập phương pháp hồi qui
Review of Regression
Nguyễn Ngọc Anh
Trung tâm Nghiên cứu Chính sách và Phát triển
Nguyễn Việt Cường
Đại học Kinh tế Quốc dân
Economics 20 - Prof. Anderson 3
Hồi qui là gì?
Là một công cụ quan trọng nhất của các nhà
nghiên cứu kinh tế
Hồi qui là phương pháp mô tả và đánh giá mối
quan hệ giữa một biến (gọi là biến phụ thuộc,
thường ký hiệu là y) với một hay nhiều biến khác
(gọi là biến độc lập, x1, x2, ... , xk )
Economics 20 - Prof. Anderson 4
So sánh hồi qui và tương quan
Trong quan hệ tương quan, hai biến y và x
là tương đương nhau.
Trong mô hình hồi qui, chúng ta coi biến
độc lập và biến phụ thuộc là hoàn toàn khác
nhau. Biến y được giả thiết là có tính ngẫu
nhiên, còn biến x được giả thiết là cố định
(nhận giá trị cố định)
Economics 20 - Prof. Anderson 5
So sánh hồi qui và tương quan
Mô hình hồi qui cho phép chúng ta ước
lượng (estimate) và suy diễn thống kê
(inferences) các tham số của tổng thể.
Trong kinh tế lượng, mục tiêu của chúng ta
là ước lượng tác động nhân quả của việc X
thay đổi một đơn vị đối với Y.
Economics 20 - Prof. Anderson 6
Nếu so sánh, thì ở giác độ tổng quan việc ước
lượng mô hình hồi qui cũng giống như ước
lượng con số trung bình. Trong mô hình hồi qui,
việc suy diễn thống kê bao gồm các việc sau
Ước lượng (Estimation):
Làm thế nào để ước lượng
Kiểm định giả thuyết (Hypothesis testing):
Tham số ước lượng được có khác 0 hay không?
Xây dựng khoảng tin cậy :
Xây dựng khoảng tin cậy cho tham số được ước
lượng
Mô hình hồi qui đơn giản
Economics 20 - Prof. Anderson 7
Mô hình hồi qui đơn giản
Mô hình chỉ bao gồm một biến độc lập k=1. Trong
mô hình này biến y chỉ phụ thuộc vào một biến x
Mô hình có thể có nhiều biến x, nhưng ta sẽ xét
trường hợp này sau. Mô hình hồi qui đơn giản có thể
sử dụng trong một số trường hợp :
Lạm phát và thất nghiệp
Lợi nhuận của chứng khoán quan hệ thế nào với
rủi ro
Mô phỏng quan hệ giữa giá chứng khoán và cổ tức
Economics 20 - Prof. Anderson 8
Mô hình hồi qui đơn giản : Ví dụ
• Giả sử ta có số liệu như :
• Chúng ta muốn tìm hiểu mối quan hệ giữa x và y
Year, t Excess return
= rXXX,t – rft
Excess return on market index
= rmt - rft
1 17.8 13.7
2 39.0 23.2
3 12.8 6.9
4 24.2 16.8
5 17.2 12.3
Economics 20 - Prof. Anderson 9
Biểu đồ rời rạc
0
5
10
15
20
25
30
35
40
45
0 5 10 15 20 25
Excess return on market portfolio
E
x
c
e
s
s
r
e
t
u
r
n
o
n
f
u
n
d
X
X
X
Economics 20 - Prof. Anderson 10
Tìm đường phù hợp nhất
Chúng ta có thể sử dụng phương trình
y= α + β x
để ước lượng đường thẳng “tốt” nhất.
β là độ dốc của đường thẳng
Đường thẳng này còn gọi là đường hồi qui
của tổng thể (population regression line)
Ta không biết α và β , nên phải ước lượng
Đường thẳng như vậy hoàn toàn mang tính
xác định (deterministic) có hợp lý không?
Economics 20 - Prof. Anderson 11
Một số ký hiệu và thuật ngữ
Viết dạng tổng quát hơn, với mô hình hồi qui
tuyến tính giản đơn, ta có y = α + β x+ u,
Đây được gọi là mô hình hồi qui tuyến tính của
tổng thể
Chúng ta thường gọi y là biến phụ thuộc và x là
biến độc lập/biến kiểm soat.
α là intercept, β là slope (độ dốc)
u là sai số của đường hồi qui tổng thể
Economics 20 - Prof. Anderson 12
Tại sao lại có sai số u
- Chúng ta có thể bỏ sót những yếu tố có tác động
đến yt
- Việc đo lường/ghi nhận số liệu đối với biến số yt có
thể có sai
- Những tác động ngẫu nhiên đối với biến số yt mà
chúng ta không thể mô hình hóa được
Economics 20 - Prof. Anderson 13
Biểu diễn mô hình trên bằng hình ảnh
Economics 20 - Prof. Anderson 14
Một số giả thiết
Trung bình của các sai số trong mô hình
hồi qui bằng 0.
E(u) = 0
Đây không phải là một giả thiết quá nặng
nề, do chúng tao luôn có thể dùng α để
chuẩn hóa trung bình/kỳ vọng toán của u,
E(u) về không.
Economics 20 - Prof. Anderson 15
Giả thiết của mô hình hồi qui
Chúng ta cần phải đưa ra giả thiết về mối
quan hệ giữa u và x
Chúng ta muốn giả thiết rằng, những thông
tin mà chúng ta biết về x sẽ không cho
chúng ta biết gì về u, và như vậy, u và x là
hoàn toàn không có quan hệ với nhau
E(u|x) = E(u) = 0, và điều này dẫn tới
E(y|x) = β0 + β1x
Economics 20 - Prof. Anderson 16
E(u|x) = E(u) = 0
Economics 20 - Prof. Anderson 17
Phương pháp bình phương cực tiểu
Ý tưởng cơ bản của việc hồi qui là để ước
lượng các tham số của tổng thể trên cơ sở
một mẫu số liệu
Gọi {(xi,yi): i=1, ,n} là một mẫu ngẫu
nhiên, có cỡ là n mà ta thu được từ tổng thể
Với mỗi quan sát trong mẫu này, ta sẽ có
yi = α + β xi + ui
Economics 20 - Prof. Anderson 18
.
..
.
y4
y1
y2
y3
x1 x2 x3 x4
}
}
{
{
u1
u2
u3
u4
x
y E(y|x) = α +β x
Đường hồi qui của tổng thể, điểm số liệu
và các sai số
Economics 20 - Prof. Anderson 19
Ước lượng với phương pháp bình
phương cực tiểu
Để ước lượng với phương pháp bình phương cực
tiểu, chúng ta cần thấy rằng, giả thiết chính của
chúng ta là E(u|x) = E(u) = 0, và điều này có
nghĩa là
Cov(x,u) = E(xu) = 0
Tại sao? Từ lý thuyết cơ bản về xác suất ta có
Cov(X,Y) = E(XY) – E(X)E(Y)
Economics 20 - Prof. Anderson 20
Ước lượng với phương pháp bình
phương cực tiểu
Với ý tưởng là tìm đường phù hợp nhất, chúng ta
có thể xây dựng bài toán cực tiểu
Tức là chúng ta muốn tìm các tham số sao cho
biểu thức dưới đây đạt giá trị cực tiểu :
Economics 20 - Prof. Anderson 21
•
• .
∑ =−−−=
t
tt xy
L 0)ˆˆ(2
ˆ
βαα∂
∂
∑ =−−−=
t
ttt xyx
L 0)ˆˆ(2ˆ βαβ∂
∂
( ) ( )∑∑
==
+−=
n
i
ii
n
i
i xyu
1
2
1
2 )ˆˆ(ˆ βα
Economics 20 - Prof. Anderson 22
Ước lượng với phương pháp bình
phương cực tiểu
Chúng ta có thể sử dụng đạo hàm để giải bài toán cực tiểu
này, chúng ta nếu lấy đạo hàm bậc 1, theo α va β và giải các
phương trình thu. Qua đó ta có thể ước lượng được các tham
số của mô hình hồi qui.
SXY = đồng phương sai của (X, Y)
SX2 = phương sai của (X)
2
1
2
1
)(
)()(ˆ
X
XY
N
i i
N
i ii
S
S
XX
YYXX =−
−−= ∑
∑
=
=βXY βα ˆˆ −=
Economics 20 - Prof. Anderson 23
Tóm tắt về ước lượng tham số beta
(slope estimate)
Ước lượng về độ dốc là đồng phương sai
tính trên mẫu giữa y và x, chia cho phương
sai mẫu của x.
Nếu x và y có tương quan thuận (dương) với
nhau, thì ước lượng có dấu dương
Nếu x và y có tương quan nghịch (âm) với
nhau, thì ước lượng có dấu âm
Chúng ta chỉ cần x biến thiên trong
Economics 20 - Prof. Anderson 24
OLS
Về mặt trực giác, OLS là việc ước lượng đường
thẳng qua các điểm số liệu trong mẫu sao cho tổng
khoảng cách bình phương sai số là nhỏ nhất, nên
có tên là bình phương cực tiểu.
Sai số, û, chính là ước lượng cho sai số u và là sự
sai khác giữa đường ước lượng (đường hồi qui
trên mẫu) và các điểm số liệu.
Economics 20 - Prof. Anderson 25
.
..
.
y4
y1
y2
y3
x1 x2 x3 x4
}
}
{
{
û1
û2
û3
û4
x
y
xy 10 ˆˆˆ ββ +=
Đường hồi qui mẫu, điểm số liệu
và các sai số ước lượng
Economics 20 - Prof. Anderson 26
• Đường hồi qui tổng thể là mô hình mà chúng ta cho
rằng đã tạo ra số liệu, và các tham số thực là α và β.
Hồi qui tổng thể
Hồi qui mẫu
và chúng ta biết rằng .
• Chúng ta sử dụng đường hồi qui mẫu để suy diễn về
đường mô hình của tổng thể
• Chúng ta cũng muốn biết là các ước lượng α và β
có phải là các ước lượng tôt hay không
tt xy βα ˆˆˆ +=
ttt uxy ++= βα
ttt yyu ˆˆ −=
Economics 20 - Prof. Anderson 27
Tính chất của OLS
Tổng các sai số (residual) OLS là bằng 0
Như vậy, trung bình mẫu các sai số OLS
cũng bằng 0
Đồng phương sai mẫu giữa các biến độc
lập và sai số OLS cũng bằng 0
Đường OLS sẽ chạy xuyên qua điểm trung
bình của số liệu
Economics 20 - Prof. Anderson 28
Biểu diễn bằng đại số, ta có
xy
ux
n
u
u
n
i
ii
n
i
in
i
i
10
1
1
1
ˆˆ
0ˆ
0
ˆ
thus,and 0ˆ
ββ +=
=
==
∑
∑∑
=
=
=
Economics 20 - Prof. Anderson 29
Tính chất của ước lượng OLS
Tuyến tính (linear)
Không trệch (unbiased)
Hiệu quả nhất (best)
Best Linear Unbiased Estimator
$α $β
$β
$β
$β
$β
$α
Economics 20 - Prof. Anderson 30
Sử dụng STATA để ước lượng OLS
Thực hiện hồi qui trong STATA rất giản
đơn. Và để ước lượng mô hình hồi qui y
theo x thì ta chỉ cần đánh lệnh
reg y x
Economics 20 - Prof. Anderson 31
Ước lượng sử dụng STATA
regress testscr str, robust
Regression with robust standard errors Number of obs = 420
F( 1, 418) = 19.26
Prob > F = 0.0000
R-squared = 0.0512
Root MSE = 18.581
-------------------------------------------------------------------------
| Robust
testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+----------------------------------------------------------------
str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671
_cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057
-------------------------------------------------------------------------
Economics 20 - Prof. Anderson 32
Mức độ phù hợp của mô hình
(Goodness-of-Fit)
( )
( )
SSR SSE SST co Ta
(SSR)du con phuongbinh Phan tông ˆ
(SSE) thich giai duoc phuongbinh Phân tông ˆ
(SST)cach khoang phuongbinh Tông
:saunhu nghiađinh somôt co se taChúng ˆˆ
: thichgiai duoc khôngphân thich vàgiai duocPhân
phân 2 có gôm làsát quan môi coi thcó taChúng
2
2
2
+=
−
−
+=
∑
∑
∑
i
i
i
iii
u
yy
yy
uyy
Economics 20 - Prof. Anderson 33
Chứng minh rằng SST = SSE + SSR
( ) ( ) ( )[ ]
( )[ ]
( ) ( )
( )
( )∑
∑
∑ ∑∑
∑
∑∑
=−
+−+=
−+−+=
−+=
−+−=−
0 ˆˆ rangbiêt tavà
SSE ˆˆ2 SSR
ˆˆˆ2ˆ
ˆˆ
ˆˆ
22
2
22
yyu
yyu
yyyyuu
yyu
yyyyyy
ii
ii
iiii
ii
iiii
Economics 20 - Prof. Anderson 34
Mức độ phù hợp của mô hình
(Goodness-of-Fit)
Chúng ta đánh giá thế nào về đường hồi qui mà ta
ước lượng? Có phù hợp với số liệu hay không?
Có thể tính tỷ lệ tổng bình phương khoảng cách
(SST) được giải thích bởi mô hình, và gọi tỷ lệ
này là R-bình phương của mô hình hồi qui.
R2 = SSE/SST = 1 – SSR/SST
Nằm trong khoảng 0-1. Càng lớn càng tốt!!!!
Economics 20 - Prof. Anderson 35
Phân phối mẫu của ước lượng OLS
Ước lượng OLS được tính toán dựa trên một mẫu số liệu, một
mẫu số liệu khác sẽ cho ta một giá trị khác của 1ˆβ . Đây được gọi
là tính bất định theo mẫu của 1ˆβ . Chúng ta muốn
• đánh giá mức độ bất định của 1ˆβ
• Sử dụng 1ˆβ để tiến hành kiểm định giả thuyết như β1 = 0
• Xây dựng khoảng tin cậy cho β1
• Tất cả những điều này đòi hỏi chúng ta phải xem xét tới
phân phối mẫu (sampling distribution) của ước lượng
OLS. Để làm được điều này, ta phải xem xét Phân phối
của ước lượng OLS
Economics 20 - Prof. Anderson 36
Hàm phân phối của 1βˆ
Cũng giống như trung bình mẫu, Y , 1βˆ cũng có phân phối mẫu .
• Vậy kỳ vọng toán của E( 1βˆ ) là bao nhiêu
• Nếu như E( 1βˆ ) = β1, thì ước lượng OLS là ước lượng
không trệch – Còn muốn gì hơn?!
• Phương sai của 1βˆ - var( 1βˆ )? (cho chúng ta biết được mức
độ bất định của ước lượng)
• Phân phối của 1βˆ trong các mẫu nhỏ là phân phối gì ?
• Vấn đề này rất khó!!!!!
• Phân phối của 1βˆ ở các mẫu lớn là phân phối gì ?
• Với các mẫu lớn, 1βˆ có phân bổ là phân bổ chuẩn
(normally distributed).
Economics 20 - Prof. Anderson 37
Tính không trệch của OLS
(Unbiasedness)
Giả thiết rằng mô hình tổng thể là tuyến
tính theo tham số có dạng y = β0 + β1x + u
Giả thiết rằng chúng ta sử dụng một mẫu có
qui mô n, {(xi, yi): i=1, 2, , n}, được lấy
từ mô hình tổng thể. Như vậy ta có thể biểu
diễn mô hình mẫu là yi = β0 + β1xi + ui
Giả thiết E(u|x) = 0 và như vậy E(ui|xi) = 0
Giả thiết rằng xi có biến thiên
Economics 20 - Prof. Anderson 38
Tính không trệch của OLS
(Unbiasedness)
Để xét tính không trệch của ước lượng, chúng ta
viết lại dưới dạng tham số của tổng thể.
Viết một công thức đơngiản là
( )
( )∑
∑
−≡
−=
22
21 where,ˆ
xxs
s
yxx
ix
x
iiβ
Economics 20 - Prof. Anderson 39
Tính không trệch của OLS
(Unbiasedness)
( ) ( )( )
( ) ( )
( )
( ) ( )
( ) ii
iii
ii
iii
iiiii
uxx
xxxxx
uxx
xxxxx
uxxxyxx
∑
∑∑
∑
∑∑
∑∑
−+
−+−
=−+
−+−
=++−=−
10
10
10
ββ
ββ
ββ
Economics 20 - Prof. Anderson 40
Tính không trệch của OLS
(Unbiasedness)
( )
( ) ( )
( )
( )
211
2
1
2
ˆ
thusand ,
asrewritten becan numerator the,so
,0
x
ii
iix
iii
i
s
uxx
uxxs
xxxxx
xx
∑
∑
∑∑
∑
−+=
−+
−=−
=−
ββ
β
Economics 20 - Prof. Anderson 41
Tính không trệch của OLS
(Unbiasedness)
( )
( ) ( ) 1211
21
1ˆ
then,1ˆ
thatso ,let
βββ
ββ
=⎟⎠
⎞⎜⎝
⎛+=
⎟⎠
⎞⎜⎝
⎛+=
−=
∑
∑
ii
x
ii
x
i
ii
uEdsE
uds
xxd
Economics 20 - Prof. Anderson 42
Tính không trệch của OLS
(Unbiasedness)
Các ước lượng OLS của tham số β1 và β0 là
không trệch
Việc chứng minh tính không trêch, dựa trên 04
giả thiết. Nếu một giả thiết mà không đúng, thì
ước lượng OLS sẽ không phải là không trệch
Lưu ý rằng, tính không trệch là tính chất của phép
ước lượng (estimator) – còn trong một mẫu cụ thể,
thì ước lượng thu được có thể nhiều ít khác với
tham số thực tế
Economics 20 - Prof. Anderson 43
Phương sai của ước lượng OLS
Chúng ta biết rằng hàm phân bổ (sampling
distribution) của ước lượng nằm xung
quanh tham số thực
Muốn biết xem hàm phân bổ này có độ
phân tán như thế nào
Đưa thêm một giả thiết nữa về phương sai
Giả thiết là Var(u|x) = σ2
(Homoskedasticity)
Economics 20 - Prof. Anderson 44
Phương sai của ước lượng OLS
Var(u|x) = E(u2|x)-[E(u|x)]2
E(u|x) = 0, so σ2= E(u2|x) = E(u2) = Var(u)
Như vậy, σ2 cũng là phương sai không điều
kiện, và được gọi phương sai của sai số
σ, được gọi là sai số chuẩn của sai số
Có thể nói rằng : E(y|x)=β0 + β1x và
Var(y|x) = σ2
Economics 20 - Prof. Anderson 45
.
.
x1 x2
Trường hợp phương sai đồng nhât
(Homoskedastic)
E(y|x) = β0 + β1x
y
f(y|x)
Economics 20 - Prof. Anderson 46
.
xx1 x2
yf(y|x)
Phương sai không đồng nhât
(Heteroskedastic)
x3
. . E(y|x) = β0 + β1x
Economics 20 - Prof. Anderson 47
Phương sai của ước lượng OLS
( )
( ) ( )
( )1222222
2
2
2
222
2
2
2
2
2
2
2
211
ˆ1
11
11
1ˆ
βσσ
σσ
ββ
Varsss
dsds
uVardsudVars
udsVarVar
x
x
x
i
x
i
x
ii
x
ii
x
ii
x
==⎟⎠
⎞⎜⎝
⎛
=⎟⎠
⎞⎜⎝
⎛=⎟⎠
⎞⎜⎝
⎛=
⎟⎠
⎞⎜⎝
⎛=⎟⎠
⎞⎜⎝
⎛
=⎟⎟⎠
⎞⎜⎜⎝
⎛ ⎟⎠
⎞⎜⎝
⎛+=
∑∑
∑∑
∑
Economics 20 - Prof. Anderson 48
Phương sai của ước lượng OLS
Phương sai của sai số, σ2 càng lơn, thì
phương sai của ước lượng càng lớn
xi biến thiên càng nhiều, thì phương sai
của ước lượng càng nhỏ
Do đó, mẫu lớn sẽ làm giảm phương sai
của ước lượng
Vấn đề là phương sai của sai số chúng ta
lại không biết
Economics 20 - Prof. Anderson 49
Ước lượng phương sai của sai số
Chúng ta không biết phương sai của sai, σ2,
của sai số là bao nhiêu vì chúng ta không
quan sát được sai số, ui
Chúng ta chỉ quan sát được , ûi
Chúng ta có thể sử dụng ûi để ước lượng
phương sai của sai số
Economics 20 - Prof. Anderson 50
Ước lượng phương sai của sai số
( )( ) ( )
( ) ( )2/ˆ2
1ˆ
is ofestimator unbiasedan Then,
ˆˆ
ˆˆ
ˆˆˆ
22
2
1100
1010
10
−=−=
−−−−=
−−++=
−−=
∑ nSSRun
u
xux
xyu
i
i
iii
iii
σ
σ
ββββ
ββββ
ββ
Economics 20 - Prof. Anderson 51
Ước lượng phương sai của sai số
( )
( ) ( )( ) 2121
1
2
/ˆˆse
, ˆ oferror standard the
have then wefor ˆ substitute weif
ˆsd that recall
regression theoferror Standardˆˆ
∑ −=
=
==
xx
s
i
x
σβ
β
σσ
σβ
σσ
Economics 20 - Prof. Anderson 52
Tóm tắt về phân phối mẫu của 1ˆβ
Nếu các giả thiết của OLS là đúng thì
• Hàm phân phối mẫu của 1ˆβ có:
• E( 1ˆβ ) = β1 (tức là, 1ˆβ là ước lượng không trệch)
• var( 1ˆβ ) = 4var[( ) ]1 i x i
X
X u
n
μ
σ
−× ∝ 1
n
.
• Khi mẫu lớn , 1 1
1
ˆ ˆ( )
ˆvar( )
Eβ β
β
− ~ N(0,1) (CLT)
• .
Economics 20 - Prof. Anderson 53
Kiểm định giả thuyết và sai số chuẩn của 1ˆ
Mục tiêu của việc kiểm định trong mô hình hồi qui là sử dụng số
liệu để kiểm định một giả thuyết về tổng thể như β1 = 0, và đưa
ra kết luận liệu giả thuyết có đúng hay không
Giả thuyết trống và giả thuyết thay thế hai phía
H0: β1 = β1,0 vs. H1: β1 ≠ β1,0
Trong đó β1,0 là một giá trị giả thuyết
Giả thuyết trống và giả thuyết thay thế một phía :
H0: β1 = β1,0 vs. H1: β1 < β1,0
β
Economics 20 - Prof. Anderson 54
Phương pháp kiểm định: Xây dựng thống kê t hoặc z, tính p-
value, hoặc so sánh với giá trị tới hạn của hàm phân phối N(0,1))
• Nói chúng ta có:
• t = (ước lượng – giá trị muốn kiểm định)/sai số chuẩn của ước
lượng
Khi kiểm định về trung bình của Y: ta có t = ,0
/
Y
Y
Y
s n
μ−
• Khi kiểm định β1, ta có t = 1 1,0
1
ˆ
ˆ( )SE
β β
β
−
,
Economics 20 - Prof. Anderson 55
Công thức tính SE( )1ˆβ
1
2
ˆˆβσ =
2
2 2
1 estimator of
(estimator of )
v
Xn
σ
σ× =
2
1
2
2
1
1 ˆ
1 2
1 ( )
n
i
i
n
i
i
v
n
n
X X
n
=
=
−×
⎡ ⎤−⎢ ⎥⎣ ⎦
∑
∑
Trong đó ˆiv = ˆ( )i iX X u− .
•
• OK. SE( 1ˆβ ) trông phức tạp, nhưng STATA tính rất nhanh và
ta không phải nhớ các công thức này .
Economics 20 - Prof. Anderson 56
Ví dụ
Ước lượng của mô hình hồi qui: Test score = 698.9 – 2.28×STR
STATA cũng cho ta ước lượng độ lệch chuẩn của con số ước
lượng là
SE( 0βˆ ) = 10.4 SE( 1ˆβ ) = 0.52
Ta có thể tính các kiểm định thống kê cho 1ˆβ với giả thuyết Ho:
β1,0 = 0
t-statistic testing β1,0 = 0 = 1 1,0
1
ˆ
ˆ( )SE
β β
β
−
= 2.28 0
0.52
− − = –4.38
• Ở mức ý nghĩa 1% giá trị là 2.58, nên ta có thể bác bỏ giả
thuyết trông với mức ý nghĩa 1%.
• Ta cũng có thể tính giá trị p-value . Nhưng STATA làm hộ
hêt rồi !
Economics 20 - Prof. Anderson 57
Ước lượng sử dụng STATA
regress testscr str, robust
Regression with robust standard errors Number of obs = 420
F( 1, 418) = 19.26
Prob > F = 0.0000
R-squared = 0.0512
Root MSE = 18.581
-------------------------------------------------------------------------
| Robust
testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+----------------------------------------------------------------
str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671
_cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057
-------------------------------------------------------------------------
Economics 20 - Prof. Anderson 58
Tóm tắt: kiểm định H0: β1 = β1,0 v. H1: β1 ≠ β1,0,
• Tính kiểm định thống kê t (t-statistic)
t = 1 1,0
1
ˆ
ˆ( )SE
β β
β
−
=
1
1 1,0
2
ˆ
ˆ
ˆβ
β β
σ
−
• Bác bỏ giả thuyết trống với mức ý nghía 5% nếu |t| > 1.96
• Bác bỏ giả thuyết trống nếu p<5%
• Việc kiểm định này dựa trên mẫu khoảng ít nhất là 30 quan
sát.
Economics 20 - Prof. Anderson 59
Đọc kết quả STATA
regress testscr str, robust
Regression with robust standard errors Number of obs = 420
F( 1, 418) = 19.26
Prob > F = 0.0000
R-squared = 0.0512
Root MSE = 18.581
-------------------------------------------------------------------------
| Robust
testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+----------------------------------------------------------------
str | -2.279808 .5194892 -4.38 0.000 -3.300945 -1.258671
_cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057
-------------------------------------------------------------------------
Y = 698.9 – 2.28×STR, , R2 = .05,
(10.4) (0.52)
t (β1 = 0) = –4.38, p-value = 0.000 (2-sided)
Khoảng tin cậy 95% của β1 là (–3.30, –1.26)
Các file đính kèm theo tài liệu này:
- day_2_review_of_regression_ols1_4288.pdf