Nguyên lý thống kê - Chương 4: Hồi quy và tương quan

1. Mối liên hệ giữa các hiện tượng KT-XH với

phương pháp hồi quy và tương quan

2. Liên hệ tương quan tuyến tính giữa hai tiêu

thức

3. Liên hệ tương quan phi tuyến tính giữa hai tiêu

thức

4. Liên hệ tương quan tuyến tính giữa nhiều tiêu

thức (hồi quy bội)

pdf8 trang | Chia sẻ: tieuaka001 | Lượt xem: 1878 | Lượt tải: 0download
Nội dung tài liệu Nguyên lý thống kê - Chương 4: Hồi quy và tương quan, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1Chương 6: HỒI QUY VÀ TƯƠNG QUAN 1. Mối liên hệ giữa các hiện tượng KT-XH với phương pháp hồi quy và tương quan 2. Liên hệ tương quan tuyến tính giữa hai tiêu thức 3. Liên hệ tương quan phi tuyến tính giữa hai tiêu thức 4. Liên hệ tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan 1.1. Mối liên hệ giữa các hiện tượng KT-XH 2 loại liên hệ Liên hệ hàm số Liên hệ tương quan 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan Liên hệ hàm số: Mối liên hệ hoàn toàn chặt chẽ và được biểu hiện dưới dạng một hàm số y = f(x) nghĩa là sự biến đổi của x hoàn toàn quyết định sự thay đổi của y Không chỉ thấy được trên toàn bộ tổng thể mà còn thấy được trên từng đơn vị riêng biệt. Ví dụ: S = v.t 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan Liên hệ tương quan: Mối liên hệ không hoàn toàn chặt chẽ giữa các hiện tượng nghiên cứu. Ví dụ? Thường không biểu hiện rõ trên từng đơn vị cá biệt, do đó cần nghiên cứu hiện tượng số lớn. Phương pháp dùng nghiên cứu mối liên hệ tương quan là phương pháp hồi qui và tương quan. 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan Thực chất của PP hồi quy và tương quan – Xác định mô hình/hàm số – Xác định mức độ chặt chẽ của mối liên hệ tương quan 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan 1.2. Nhiệm vụ chủ yếu của PP HQ&TQ Nhiệm vụ tổng quát: Là phương pháp toán học được vận dụng trong thống kê để biểu hiện và phân tích mối liên hệ tương quan giữa các hiện tượng kinh tế xã hội. 21. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan Nhiệm vụ cụ thể: Xác định phương trình hồi quy gồm 4 bước B1: Dựa vào phân tích lý luận để giải thích sự tồn tại thực tế và bản chất của mối liên hệ: - Các tiêu thức nghiên cứu có liên hệ không - Xác định tiêu thức nguyên nhân, tiêu thức kết quả 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan B2: Xác định hình thức, tính chất của mối liên hệ. - Hình thức: thuận hay nghịch - Tính chất: Tuyến tính hay phi tuyến tính B3: Xác định mô hình hồi quy biểu diễn mối liên hệ. B4: Tính toán các tham số, giải thích ý nghĩa các tham số. b/ Đánh giá mức độ chặt chẽ của mối liên hệ tương quan - Hệ số tương quan - Tỷ số tương quan. 1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 67,08 34,05 23,54 23,03 35,06 46,57 69,09 710,010 22,52 11,01 Nhu cầu hàng hóa (y) Thu nhập (x) Stt VD trang 201. Khảo sát ngẫu nhiên 10 khách hàng ta thu được dữ liệu sau: • Ta thấy khi thu nhập tăng nhu cầu về hàng hóa dịch vụ tăng. Tuy nhiên mức độ tăng không hoàn toàn. • Ta xem xét mối liên hệ tuyến tính giữa 2 tiêu thức x và y bằng cách xây dựng mô hình toán học • Dùng đồ thị quan sát và cho nhận xét 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Mối quan hệ giữa thu nhập và cầu hàng hóa 0 1 2 3 4 5 6 7 8 1 .0 2 .5 3 .0 3 .5 4 .0 5 .0 6 .5 7 .0 9 .0 1 0. 0 Thu nhập bình quân Cầ u hà ng h óa ü Đường gấp khúc trên đồ thị có xu hướng tăng dần. Đướng gấp khúc vươn theo hướng từ bên trái phía dưới sang bên phải phía trên 32. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Mối quan hệ giữa thu nhập và cầu hàng hóa 0 1 2 3 4 5 6 7 8 1. 0 2. 5 3. 0 3. 5 4. 0 5. 0 6. 5 7. 0 9. 0 10 .0 Thu nhập bình quân Cầ u h àn g h óa •Trên đồ thị, đường gấp khúc được gọi là đường hồi quy thực nghiệm, hình thành từ tài liệu đã cho. Đường này chưa phản ánh rõ mối liên hệ giữa 2 tiêu thức Đường thẳng đi theo cùng hướng với đường gấp khúc gọi là đường hồi quy lý thuyết được biểu hiện dưới dạng 1 hàm số yx = a + bx Có vô số đường thẳng được vẽ. Chọn 1 đường thẳng cực tiểu hóa được tổng các độ lệch bình phương các chênh lệch giữa giá trị thực tế yt với giá trị yx Trong đường hồi qui lý thuyết : yx = a + bx Thì: x: Trị số của tiêu thức nguyên nhân yx: Trị số của tiêu thức kết quả y được tính theo phương trình hồi quy a: Tham số tự do nói lên ảnh hưởng của các nguyên nhân khác ngoài x đối với y b : Hệ số hồi qui nói lên ảnh hưởng của x đối với y, cụ thể mỗi khi x tăng 1 đơn vị thì y tăng bình quân b đơn vị. 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Phương pháp xác định các tham số của PT hồi quy Xác định a,b dựa vào phương pháp bình phương nhỏ nhất. Phương pháp bình phương nhỏ nhất? Tối thiểu hoá tổng bình phương các độ lệch giữa giá trị thực tế yt và giá trị điều chỉnh của biến phụ thuộc yx. å =-= min)( 2xt yyS 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Xác định các tham số Cách 1 : Tính a, b từ hệ phương trình ∑y = na + b∑x ∑xy = a∑x + b∑x2 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 52.6 38.4 76.525 --341.75 238.0 36.0 51.5 16.5 11.6 23.5 3.4 4.9 100.0 70.0 7.0 10.0 10.0 9.2 5.8 14.8 2.4 3.9 81.0 54.0 6.0 9.0 9.0 4.4 5.8 3.4 2.4 1.9 49.0 42.0 6.0 7.0 8.0 0.5 0.2 1.8 0.4 1.4 42.3 26.0 4.0 6.5 7.0 0.1 0.4 0.0 (0.6)(0.2)25.0 15.0 3.0 5.0 6.0 0.7 0.4 1.3 (0.6)(1.2)16.0 12.0 3.0 4.0 5.0 2.6 2.6 2.7 (1.6)(1.7)12.3 7.0 2.0 3.5 4.0 3.4 2.6 4.6 (1.6)(2.2)9.0 6.0 2.0 3.0 3.0 4.2 2.6 7.0 (1.6)(2.7)6.3 5.0 2.0 2.5 2.0 10.8 6.8 17.2 (2.6)(4.2)1.0 1.0 1.0 1.0 1.0 (x-x).(y-y) (y-y)2(x-x)2(y-y) (x-x) x2x.yy x Stt • Từ bảng tính toán trên thay số liệu vào phương trình được hệ sau: • Giải hệ PT ta tìm được a = 0.06195; b = 0.687 • Vậy, phương trình hồi quy có dạng • yx = 0.06195 + 0.687 x 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 36 = 10 a + 51.5 b 238 = 51.5 a + 341.75 b 4• a = 0.06195 là mức độ xuất phát đầu tiên của đường hồi quy lý thuyết, không phụ thuộc vào x, nói lên ảnh hưởng của các nhân tố khác tới nhu cầu hàng hóa • b = 0.687 là hệ số hồi quy, nói lên ảnh hưởng của tiêu thức nguyên nhân x đối với tiêu thức kết quả y. • Có nghĩa là: Nếu thu nhập bình quân 1 tháng tăng lên 1 triệu thì nhu cầu hàng hóa tăng thêm 0.687 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Cách 2 : Tính a, b từ công thức trong sách trang 206 Kết quả tương tự 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức • Hệ số tương quan (rxy) Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính (xem xét giữa tiêu thức nguyên nhân và tiêu thức kết quả có mối liên hệ với nhau đến chứng mực nào). ( ) ( )2 2 n yy n xx y x - = - = d d Trong đó độ lệch chuẩn được tính y x xy yx xy br yxxy r d d dd . . . = - = ( ) ( ) ( )å å å -- -´- = 22 )(. yyxx yyxx r ii ii xy 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Tác dụng của r – Xác định cường độ của mối liên hệ – Xác định phương hướng của mối liên hệ • r > 0 : liên hệ tương quan thuận • r < 0 : liên hệ tương quan nghịch - Dùng nhiều trong phân tích và dự đoán TK 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức Tính chất của r : -1 ≤ rxy ≤ 1 + rxy > 0 : Giữa x và y có mối liên quan thuận + rxy = ± 1 : Giữa x và y có mối liên hệ hàm số + rxy = 0 : Giữa x và y không có mối liên hệ tương quan tuyến tính + rxy càng tiến gần tới ± 1 : Mối liên hệ giữa x và y càng chặt chẽ. 2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức • Tiếp theo ví dụ tại bảng 6.1, ta tính rxy 97,0 42,5 26,5 959,1766,2 6,315,58,23 . . == ´ ´- = - = yx xy yxxy r ss • Trong đó: ( ) ( ) 959,1 10 4,38 766,2 10 525,76 2 2 == - = == - = n yy n xx y x d d 53. LH tương quan phi tuyến tính giữa 2 tiêu thức Phương trình parabol bậc 2 yx = a + bx + cx2 Xác định a,b,c: ∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3) Lập bảng để tính các trị số: ∑x; ∑y; ∑xy; ∑x2; ∑x3; ∑x4 PT barabon bậc 2 được dùng trong trường hợp khi tiêu thức nguyên nhân tăng (giảm) với lượng đều nhau thì tiêu thức kết quả biến động với lượng không đều. Ví dụ: Liên hệ giữa tuổi nghề và năng suất lao động; lượng phân bón và năng suất thu hoạch; thu nhập và cầu hàng hóa 3. LH tương quan phi tuyến tính giữa 2 tiêu thức 3. LH tương quan phi tuyến tính giữa 2 tiêu thức • Ví dụ: Có tài liệu về tuổi nghề và năng suất lao động tại Công ty X như sau: 38 36 47 33 52576058555144352312NSLĐ (SP) 30272421181512963 Tuổi nghề (Năm) 0 10 20 30 40 50 60 70 1 2 3 4 5 6 7 8 9 10 11 12 Series1 Poly. (Series1) 3. LH tương quan phi tuyến tính giữa 2 tiêu thức 260304917510288324164268114485850532234 144416796164924846656136812963836 220911859215118335937155110894733 2704810000468002700015609005230 3249531441415531968315397295727 3600331776345601382414405766024 336419448125578926112184415821 30251049761782058329903245518 2601506251147533757652255115 193620736633617285281444412 12256561283572931581359 529129682821613836236 1448110827369123 y*yx*x*x*xx*x*yx*x*xx*yx*xy (NSLĐ)x (tuổi nghề) ∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3) 532 = 12a + 234b + 5850c 11448 = 234a + 5850b + 164268c 288324 = 5850a + 164268b + 4917510c yx = -4,5 + 5,5x – 0,1x2 3. LH tương quan phi tuyến tính giữa 2 tiêu thức 63. LH tương quan phi tuyến tính giữa 2 tiêu thức Phương trình hypebol x bayx 1 .+= Xác định a, b dựa vào hệ phương trình sau: ï ï î ïï í ì += += å å å åå 2 11 . 1 1 x b x ay x x bnay 3. LH tương quan phi tuyến tính giữa 2 tiêu thức Phương trình hypebol được dùng trong trường hợp trị số của tiêu thức nguyên nhân tăng thì trị số của tiêu thức kết quả giảm với tốc độ không đều Ví dụ: liên hệ giữa sản lượng và giá thành đơn vị sản phẩm, liên hệ giữa mức tiêu thụ hàng hóa với tỷ suất phí lưu thông VD: Nghiên cứu mối liên hệ giữa mức tiêu thụ hàng hóa với tỷ suất phí lưu thông 5.05.35.86.17.07.97.88.19.210.0 Tỷ suất phí lưu thông (%) 8006004503002201801501209075 Mức tiêu thụ (triệu) 10 9.2 8.1 7.8 7.9 7 6.1 5.8 5.3 5 0 2 4 6 8 10 12 75 90 120 150 180 220 300 450 600 800 TSPLT 3. LH tương quan phi tuyến tính giữa 2 tiêu thức Tỷ số tương quan (η) - êta Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan phi tuyến tính (giống như ý nghĩa của hệ số tương quan r). 2 2 )( 2 2 )( 2 2 2 1 y xy y xyy y xy d d d dd d d h -= - == 3. LH tương quan phi tuyến tính giữa 2 tiêu thức Trong đó : n yy n y n y n yy x xy y å ååå - = ÷ ÷ ø ö ç ç è æ -= - = 2 2 )( 222 2 )( )( d d 2 )( 22 xyyxy ddd -=Quan hệ giữa ba loại phương sai 73. LH tương quan phi tuyến tính giữa 2 tiêu thức Tính chất của (η) - êta Tỷ số tương quan có giá trị nằm trong khoảng [0 ; 1] 0 ≤ η ≤ 1 Nếu η = 0 : x, y không có mối liên hệ tương quan Nếu η = 1 : x, y có liên hệ hàm số Nếu η càng gần 1 thì liên hệ tương quan càng chặt chẽ 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) Trong thực tế không phải chỉ có tiêu thức x ảnh hưởng đến y, sự thay đổi của y sẽ được giải thích toàn diện hơn khi nếu đặt trong mối quan hệ với nhiều tiêu thức nguyên nhân. Đây là phương pháp phân tích hồi quy bội. Phương trình hồi quy: nnxaxaxaaY ++++= ...22110 Trong đó: x1, x2,,xn: là các nhân tố ảnh hưởng, có liên hệtương quan với y • a1, a2, , an: là hệ số hồi quy • a0: giá trị ước lượng của tiêu thức y khi x=0 • 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) • Xác định hệ số a dựa vào hệ phương trình ååååå ååååå ååååå åååå ++++= ++++= ++++= ++++= 2 22110 2 2 22211202 1212 2 11101 22110 ... ........ ... ... ... nnnnnn nn nn nn xaxxaxxaxayx xxaxaxxaxayx xxaxxaxaxayx xaxaxanay 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) • Với 2 tiêu thức nguyên nhân (x, z). • Phương trình hồi quy tuyến tính có dạng åååå åååå ååå ++= ++= ++= 2 2 zcxzbzayz zxcxbxaxy zcxbnay czbxaYxz ++= Với a = a0; b = a1; c = a2. Các tham số a; b; c được tính từ hệ PT sau: 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) • Với 3 tiêu thức nguyên nhân (x, z, v). • Phương trình hồi quy tuyến tính có dạng dvczbxaYxzv +++= Hệ số tương quan bội: Đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính đa biến. Công thức: å å - - -= -= 2 2 ... 2 2 )...( ... )( )( 1 1 21 21 21 yy yy R n n n xxx y xxxy xxxy d d 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) - - - 2 2 .. 2 2 ).( ... )( )( 1 21 21 2 yy yy n n n xxx y xxxy 84. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) • Tính chất của hệ số tương quan bội • Có giá trị nằm trong khoảng [0 ; 1] • 0 ≤ Ryx1x2xn ≤ 1 • Nếu R = 0 : Giữa y và các x1, x2,, xn không có liên hệ tuyến tính. • Nếu R = 1 : Giữa y và các x1, x2,, xn có liên hệ hàm số. • R càng gần 1, mối liên hệ giữa y và các x1, x2,, xn càng chặt chẽ. 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) • Cụ thể, trường hợp có liên hệ tương quan giữa 3 tiêu thức x, y, z (trong đó y là tiêu thức kết quả), hệ số tương quan bội sẽ là: å å - - -= -= 2 2 2 2 )( )( )( 1 1 yy yy R xyi y xzy xyz d d 4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội) • Hệ số tương quan riêng giữa x và y (loại trừ ảnh hưởng của z) ( ) ( ) ( ) ( )22)( 22)( 11 11 xzxy xzxyzzy xzy xzxy zxyxxy zxy rr rrr r rr rrr r -´- ´- = -´- ´- =

Các file đính kèm theo tài liệu này:

  • pdfchuong_05_1_6135.pdf
Tài liệu liên quan