1. Mối liên hệ giữa các hiện tượng KT-XH với
phương pháp hồi quy và tương quan
2. Liên hệ tương quan tuyến tính giữa hai tiêu
thức
3. Liên hệ tương quan phi tuyến tính giữa hai tiêu
thức
4. Liên hệ tương quan tuyến tính giữa nhiều tiêu
thức (hồi quy bội)
8 trang |
Chia sẻ: tieuaka001 | Lượt xem: 1878 | Lượt tải: 0
Nội dung tài liệu Nguyên lý thống kê - Chương 4: Hồi quy và tương quan, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1Chương 6: HỒI QUY VÀ TƯƠNG QUAN
1. Mối liên hệ giữa các hiện tượng KT-XH với
phương pháp hồi quy và tương quan
2. Liên hệ tương quan tuyến tính giữa hai tiêu
thức
3. Liên hệ tương quan phi tuyến tính giữa hai tiêu
thức
4. Liên hệ tương quan tuyến tính giữa nhiều tiêu
thức (hồi quy bội)
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
1.1. Mối liên hệ giữa các hiện tượng KT-XH
2 loại liên hệ
Liên hệ hàm số Liên hệ tương quan
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
Liên hệ hàm số:
Mối liên hệ hoàn toàn chặt chẽ và được biểu hiện dưới
dạng một hàm số y = f(x)
nghĩa là sự biến đổi của x hoàn toàn quyết định
sự thay đổi của y
Không chỉ thấy được trên toàn bộ tổng thể mà còn
thấy được trên từng đơn vị riêng biệt.
Ví dụ: S = v.t
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
Liên hệ tương quan:
Mối liên hệ không hoàn toàn chặt chẽ giữa các hiện
tượng nghiên cứu.
Ví dụ?
Thường không biểu hiện rõ trên từng đơn vị cá biệt,
do đó cần nghiên cứu hiện tượng số lớn.
Phương pháp dùng nghiên cứu mối liên hệ tương
quan là phương pháp hồi qui và tương quan.
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
Thực chất của PP hồi quy và tương quan
– Xác định mô hình/hàm số
– Xác định mức độ chặt chẽ của mối liên hệ tương
quan
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
1.2. Nhiệm vụ chủ yếu của PP HQ&TQ
Nhiệm vụ tổng quát:
Là phương pháp toán học được vận dụng
trong thống kê để biểu hiện và phân tích mối
liên hệ tương quan giữa các hiện tượng kinh
tế xã hội.
21. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
Nhiệm vụ cụ thể: Xác định phương trình hồi
quy gồm 4 bước
B1: Dựa vào phân tích lý luận để giải thích sự
tồn tại thực tế và bản chất của mối liên hệ:
- Các tiêu thức nghiên cứu có liên hệ không
- Xác định tiêu thức nguyên nhân, tiêu thức kết quả
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
B2: Xác định hình thức, tính chất của mối liên hệ.
- Hình thức: thuận hay nghịch
- Tính chất: Tuyến tính hay phi tuyến tính
B3: Xác định mô hình hồi quy biểu diễn mối liên hệ.
B4: Tính toán các tham số, giải thích ý nghĩa các tham
số.
b/ Đánh giá mức độ chặt chẽ của mối liên hệ tương
quan
- Hệ số tương quan
- Tỷ số tương quan.
1. Mối liên hệ giữa các hiện tượng KT-XH với PP
hồi quy và tương quan
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
67,08
34,05
23,54
23,03
35,06
46,57
69,09
710,010
22,52
11,01
Nhu cầu
hàng hóa
(y)
Thu nhập
(x)
Stt
VD trang 201.
Khảo sát ngẫu nhiên
10 khách hàng ta thu
được dữ liệu sau:
• Ta thấy khi thu nhập tăng nhu cầu về hàng hóa
dịch vụ tăng. Tuy nhiên mức độ tăng không
hoàn toàn.
• Ta xem xét mối liên hệ tuyến tính giữa 2 tiêu
thức x và y bằng cách xây dựng mô hình toán
học
• Dùng đồ thị quan sát và cho nhận xét
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Mối quan hệ giữa thu nhập và cầu hàng
hóa
0
1
2
3
4
5
6
7
8
1
.0
2
.5
3
.0
3
.5
4
.0
5
.0
6
.5
7
.0
9
.0
1
0.
0
Thu nhập bình quân
Cầ
u
hà
ng
h
óa
ü Đường gấp khúc
trên đồ thị có xu
hướng tăng dần.
Đướng gấp khúc
vươn theo hướng từ
bên trái phía dưới
sang bên phải phía
trên
32. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Mối quan hệ giữa thu nhập và cầu hàng hóa
0
1
2
3
4
5
6
7
8
1.
0
2.
5
3.
0
3.
5
4.
0
5.
0
6.
5
7.
0
9.
0
10
.0
Thu nhập bình quân
Cầ
u h
àn
g h
óa
•Trên đồ thị, đường gấp khúc được
gọi là đường hồi quy thực nghiệm,
hình thành từ tài liệu đã cho. Đường
này chưa phản ánh rõ mối liên hệ
giữa 2 tiêu thức
Đường thẳng đi theo cùng hướng với
đường gấp khúc gọi là đường hồi quy
lý thuyết được biểu hiện dưới dạng 1
hàm số yx = a + bx
Có vô số đường thẳng được vẽ.
Chọn 1 đường thẳng cực tiểu hóa
được tổng các độ lệch bình phương
các chênh lệch giữa giá trị thực tế yt
với giá trị yx
Trong đường hồi qui lý thuyết : yx = a + bx
Thì:
x: Trị số của tiêu thức nguyên nhân
yx: Trị số của tiêu thức kết quả y được tính theo phương trình
hồi quy
a: Tham số tự do nói lên ảnh hưởng của các nguyên nhân khác
ngoài x đối với y
b : Hệ số hồi qui nói lên ảnh hưởng của x đối với y, cụ thể mỗi
khi x tăng 1 đơn vị thì y tăng bình quân b đơn vị.
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Phương pháp xác định các tham số của PT hồi quy
Xác định a,b dựa vào phương pháp bình phương nhỏ
nhất.
Phương pháp bình phương nhỏ nhất?
Tối thiểu hoá tổng bình phương các độ lệch giữa giá trị
thực tế yt và giá trị điều chỉnh của biến phụ thuộc yx.
å =-= min)( 2xt yyS
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Xác định các tham số
Cách 1 : Tính a, b từ hệ phương trình
∑y = na + b∑x
∑xy = a∑x + b∑x2
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
52.6 38.4 76.525 --341.75 238.0 36.0 51.5
16.5 11.6 23.5 3.4 4.9 100.0 70.0 7.0 10.0 10.0
9.2 5.8 14.8 2.4 3.9 81.0 54.0 6.0 9.0 9.0
4.4 5.8 3.4 2.4 1.9 49.0 42.0 6.0 7.0 8.0
0.5 0.2 1.8 0.4 1.4 42.3 26.0 4.0 6.5 7.0
0.1 0.4 0.0 (0.6)(0.2)25.0 15.0 3.0 5.0 6.0
0.7 0.4 1.3 (0.6)(1.2)16.0 12.0 3.0 4.0 5.0
2.6 2.6 2.7 (1.6)(1.7)12.3 7.0 2.0 3.5 4.0
3.4 2.6 4.6 (1.6)(2.2)9.0 6.0 2.0 3.0 3.0
4.2 2.6 7.0 (1.6)(2.7)6.3 5.0 2.0 2.5 2.0
10.8 6.8 17.2 (2.6)(4.2)1.0 1.0 1.0 1.0 1.0
(x-x).(y-y) (y-y)2(x-x)2(y-y) (x-x) x2x.yy x Stt • Từ bảng tính toán trên thay số liệu vào phương
trình được hệ sau:
• Giải hệ PT ta tìm được a = 0.06195; b = 0.687
• Vậy, phương trình hồi quy có dạng
• yx = 0.06195 + 0.687 x
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
36 = 10 a + 51.5 b
238 = 51.5 a + 341.75 b
4• a = 0.06195 là mức độ xuất phát đầu tiên của
đường hồi quy lý thuyết, không phụ thuộc vào x,
nói lên ảnh hưởng của các nhân tố khác tới nhu
cầu hàng hóa
• b = 0.687 là hệ số hồi quy, nói lên ảnh hưởng
của tiêu thức nguyên nhân x đối với tiêu thức
kết quả y.
• Có nghĩa là: Nếu thu nhập bình quân 1 tháng
tăng lên 1 triệu thì nhu cầu hàng hóa tăng thêm
0.687
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Cách 2 : Tính a, b từ công thức trong sách trang
206
Kết quả tương tự
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
• Hệ số tương quan (rxy)
Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan
tuyến tính (xem xét giữa tiêu thức nguyên nhân và tiêu thức kết quả
có mối liên hệ với nhau đến chứng mực nào).
( )
( )2
2
n
yy
n
xx
y
x
-
=
-
=
d
d
Trong đó độ lệch
chuẩn được tính
y
x
xy
yx
xy
br
yxxy
r
d
d
dd
.
.
.
=
-
=
( ) ( )
( )å å
å
--
-´-
=
22 )(. yyxx
yyxx
r
ii
ii
xy
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Tác dụng của r
– Xác định cường độ của mối liên hệ
– Xác định phương hướng của mối liên hệ
• r > 0 : liên hệ tương quan thuận
• r < 0 : liên hệ tương quan nghịch
- Dùng nhiều trong phân tích và dự đoán TK
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Tính chất của r : -1 ≤ rxy ≤ 1
+ rxy > 0 : Giữa x và y có mối liên quan thuận
+ rxy = ± 1 : Giữa x và y có mối liên hệ hàm số
+ rxy = 0 : Giữa x và y không có mối liên hệ
tương quan tuyến tính
+ rxy càng tiến gần tới ± 1 : Mối liên hệ giữa x và
y càng chặt chẽ.
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
• Tiếp theo ví dụ tại bảng 6.1, ta tính rxy
97,0
42,5
26,5
959,1766,2
6,315,58,23
.
.
==
´
´-
=
-
=
yx
xy
yxxy
r
ss
• Trong đó:
( )
( )
959,1
10
4,38
766,2
10
525,76
2
2
==
-
=
==
-
=
n
yy
n
xx
y
x
d
d
53. LH tương quan phi tuyến tính giữa 2 tiêu thức
Phương trình parabol bậc 2
yx = a + bx + cx2
Xác định a,b,c:
∑y = na + b∑x + c∑x2 (1)
∑xy = a∑x + b∑x2 + c∑x3 (2)
∑x2y = a∑x2 + b∑x3 + c∑x4 (3)
Lập bảng để tính các trị số: ∑x; ∑y; ∑xy; ∑x2;
∑x3; ∑x4
PT barabon bậc 2 được dùng trong trường hợp
khi tiêu thức nguyên nhân tăng (giảm) với lượng
đều nhau thì tiêu thức kết quả biến động với
lượng không đều.
Ví dụ: Liên hệ giữa tuổi nghề và năng suất lao
động; lượng phân bón và năng suất thu hoạch;
thu nhập và cầu hàng hóa
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
• Ví dụ: Có tài liệu về tuổi nghề và năng suất lao
động tại Công ty X như sau:
38
36
47
33
52576058555144352312NSLĐ (SP)
30272421181512963
Tuổi
nghề
(Năm)
0
10
20
30
40
50
60
70
1 2 3 4 5 6 7 8 9 10 11 12
Series1
Poly. (Series1)
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
260304917510288324164268114485850532234
144416796164924846656136812963836
220911859215118335937155110894733
2704810000468002700015609005230
3249531441415531968315397295727
3600331776345601382414405766024
336419448125578926112184415821
30251049761782058329903245518
2601506251147533757652255115
193620736633617285281444412
12256561283572931581359
529129682821613836236
1448110827369123
y*yx*x*x*xx*x*yx*x*xx*yx*xy (NSLĐ)x (tuổi nghề) ∑y = na + b∑x + c∑x2 (1)
∑xy = a∑x + b∑x2 + c∑x3 (2)
∑x2y = a∑x2 + b∑x3 + c∑x4 (3)
532 = 12a + 234b + 5850c
11448 = 234a + 5850b + 164268c
288324 = 5850a + 164268b + 4917510c
yx = -4,5 + 5,5x – 0,1x2
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
63. LH tương quan phi tuyến tính giữa 2 tiêu thức
Phương trình hypebol
x
bayx
1
.+=
Xác định a, b dựa vào
hệ phương trình sau:
ï
ï
î
ïï
í
ì
+=
+=
å å å
åå
2
11
.
1
1
x
b
x
ay
x
x
bnay
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
Phương trình hypebol được dùng trong
trường hợp trị số của tiêu thức nguyên nhân
tăng thì trị số của tiêu thức kết quả giảm với
tốc độ không đều
Ví dụ: liên hệ giữa sản lượng và giá thành
đơn vị sản phẩm, liên hệ giữa mức tiêu thụ
hàng hóa với tỷ suất phí lưu thông
VD: Nghiên cứu mối liên hệ giữa mức tiêu thụ
hàng hóa với tỷ suất phí lưu thông
5.05.35.86.17.07.97.88.19.210.0
Tỷ suất
phí lưu
thông
(%)
8006004503002201801501209075
Mức
tiêu thụ
(triệu)
10
9.2
8.1
7.8 7.9
7
6.1
5.8
5.3
5
0
2
4
6
8
10
12
75 90 120 150 180 220 300 450 600 800
TSPLT
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
Tỷ số tương quan (η) - êta
Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ
tương quan phi tuyến tính (giống như ý nghĩa của hệ
số tương quan r).
2
2
)(
2
2
)(
2
2
2
1
y
xy
y
xyy
y
xy
d
d
d
dd
d
d
h -=
-
==
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
Trong đó :
n
yy
n
y
n
y
n
yy
x
xy
y
å
ååå
-
=
÷
÷
ø
ö
ç
ç
è
æ
-=
-
=
2
2
)(
222
2
)(
)(
d
d
2
)(
22
xyyxy ddd -=Quan hệ giữa ba
loại phương sai
73. LH tương quan phi tuyến tính giữa 2 tiêu thức
Tính chất của (η) - êta
Tỷ số tương quan có giá trị nằm trong khoảng [0 ; 1]
0 ≤ η ≤ 1
Nếu η = 0 : x, y không có mối liên hệ tương quan
Nếu η = 1 : x, y có liên hệ hàm số
Nếu η càng gần 1 thì liên hệ tương quan càng chặt chẽ
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
Trong thực tế không phải chỉ có tiêu thức x ảnh hưởng
đến y, sự thay đổi của y sẽ được giải thích toàn diện hơn
khi nếu đặt trong mối quan hệ với nhiều tiêu thức nguyên
nhân. Đây là phương pháp phân tích hồi quy bội.
Phương trình hồi quy:
nnxaxaxaaY ++++= ...22110
Trong đó:
x1, x2,,xn: là các nhân tố ảnh hưởng, có liên hệtương quan với y
• a1, a2, , an: là hệ số hồi quy
• a0: giá trị ước lượng của tiêu thức y khi x=0
•
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
• Xác định hệ số a dựa vào hệ phương trình
ååååå
ååååå
ååååå
åååå
++++=
++++=
++++=
++++=
2
22110
2
2
22211202
1212
2
11101
22110
...
........
...
...
...
nnnnnn
nn
nn
nn
xaxxaxxaxayx
xxaxaxxaxayx
xxaxxaxaxayx
xaxaxanay
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
• Với 2 tiêu thức nguyên nhân (x, z).
• Phương trình hồi quy tuyến tính có dạng
åååå
åååå
ååå
++=
++=
++=
2
2
zcxzbzayz
zxcxbxaxy
zcxbnay
czbxaYxz ++= Với a = a0; b = a1; c = a2.
Các tham số a; b; c được
tính từ hệ PT sau:
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
• Với 3 tiêu thức nguyên nhân (x, z, v).
• Phương trình hồi quy tuyến tính có dạng
dvczbxaYxzv +++=
Hệ số tương quan bội: Đánh giá trình độ chặt chẽ
của mối liên hệ tương quan tuyến tính đa biến.
Công thức:
å
å
-
-
-=
-=
2
2
...
2
2
)...(
...
)(
)(
1
1
21
21
21
yy
yy
R
n
n
n
xxx
y
xxxy
xxxy d
d
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
-
-
- 2
2
..
2
2
).(
...
)(
)(
1 21
21
2
yy
yy
n
n
n
xxx
y
xxxy
84. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
• Tính chất của hệ số tương quan bội
• Có giá trị nằm trong khoảng [0 ; 1]
• 0 ≤ Ryx1x2xn ≤ 1
• Nếu R = 0 : Giữa y và các x1, x2,, xn không có
liên hệ tuyến tính.
• Nếu R = 1 : Giữa y và các x1, x2,, xn có liên hệ
hàm số.
• R càng gần 1, mối liên hệ giữa y và các x1,
x2,, xn càng chặt chẽ.
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
• Cụ thể, trường hợp có liên hệ tương quan giữa
3 tiêu thức x, y, z (trong đó y là tiêu thức kết
quả), hệ số tương quan bội sẽ là:
å
å
-
-
-=
-=
2
2
2
2
)(
)(
)(
1
1
yy
yy
R
xyi
y
xzy
xyz d
d
4. LH tương quan tuyến tính giữa nhiều tiêu thức
(hồi quy bội)
• Hệ số tương quan riêng giữa x và y (loại trừ
ảnh hưởng của z)
( ) ( )
( ) ( )22)(
22)(
11
11
xzxy
xzxyzzy
xzy
xzxy
zxyxxy
zxy
rr
rrr
r
rr
rrr
r
-´-
´-
=
-´-
´-
=
Các file đính kèm theo tài liệu này:
- chuong_05_1_6135.pdf