Chương 3: Ước lượng & kiểm định giả thuyết
NỘI DUNG
1. Ước lượng
2. Kiểm định giả thuyết
3. So sánh hai tổng thể
66 trang |
Chia sẻ: phuongt97 | Lượt xem: 468 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Phân tích và xử lý dữ liệu trong kinh doanh - Chương 3: Ước lượng & kiểm định giả thuyết, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 3ƯỚC LƯỢNG & KIỂM ĐỊNH GIẢ THUYẾTNỘI DUNG1. Ước lượng2. Kiểm định giả thuyết 3. So sánh hai tổng thể1. Ước lượng1.1 Một số khái niệm thường dùng trong ước lượng1.2 Ước lượng trung bình của tổng thể chungTrường hợp đã biết phương saiTrường hợp chưa biết phương saiTrường hợp tổng thể chung có giới hạnCác nhân tố ảnh hưởng tới độ lớn của khoảng tin cây trong ước lượng1.3 Ước lượng tỷ lệ của tổng thể chung1.4 Xác định cỡ mẫu1.1 Một số khái niệm thường dùng trong ước lượngQuy trình ước lượngƯớc lượng khoảng tin cậyGiới hạn tin cậy cho trung bình tổng thể chungKhoảng tin cậyMức độ tin cậyƯớc lượng các tham số của tổng thể chungQuy trình ước lượngƯớc lượng khoảng tin cậyĐưa ra một khoảng giá trị dựa trên quan sát từ một tổng thể mẫuTìm giá trị gần nhất đối với các tham số của tổng thể chungKhoảng tin cậy luôn tương ứng với một xác suất nhất địnhXác suất đó không bao giờ đạt 100%Giới hạn tin cậy cho trung bình của tổng thể chungĐộ tin cậyLà xác suất để tham số của tổng thể chung rơi vào khoảng tin cậyBiểu hiện: độ tin cậyVí dụ: 90%; 95%; 99% là xác suất để tham số của tổng thể chung không rơi vào trong khoảng tin cậy Ước lượng các tham số của tổng thể chungƯớc lượng các tham số của tổng thể chungTừ thống kê của tổng thể mẫuTrung bìnhTỷ lệPhương saiKhác biệt1.2 Ước lượng trung bình của tổng thể chungKhoảng tin cậyTỷ lệTrung bìnhTổng thể bộc lộChưa biết Đã biết 1.2.1 Trường hợp đã biết phương saiGiả thiếtĐã biết độ lệch chuẩn của tổng thể chungTổng thể chung phân bố chuẩnNếu bất thường sử dụng mẫu lớnƯớc lượng khoảng tin cậy1.2.2 Trường hợp chưa biết phương sai (chưa biết Giả thiếtChưa biết độ lệch chuẩn của tổng thể chungTổng thể chung phải phân bố chuẩnSử dụng phân bố Students’sƯớc lượng khoảng tin cậy phân bố Students’sBậc tự do Là số lượng các quan sát được tự do thay đổi sau khi trung bình mẫu đã được tính toánVí dụ: Trung bình của 3 quan sát là 2 (hoặc một giá trị nào khác) (hoặc một giá trị nào khác) (bắt buộc phải bị ấn định theo giá trị của , để )VD1Một người dân sản xuất bí ngô. Ông ta lấy ngẫu nhiên 50 quả bí ngô, tìm được số trung bình là 3kg. Độ lệch chuẩn của tổng thể là 0,3. Tìm ước lượng khoảng tin cậy 90% của khối lượng trung bình của bí ngô của người nông dân1.2.3 Trường hợp tổng thể chung có giới hạnGiả thiếtMẫu lớn tương đối so với tổng thể chung n/N >0.05Sử dụng các nhân tố hiệu chỉnh tổng thể chung có giới hạnKhoảng tin cậy (trung bình, chưa biết phương sai) VD2 Kết quả điều tra chọn mẫu 40 nhân viên kinh doanh của một doanh nghiệp có 1000 nhân viên kinh doanh theo phương pháp chọn mẫu ngẫu nhiên cho kết quả như bảng 6.1 trang 254 Hãy tính doanh số trung bình của một nhân viên kinh doanh cho toàn doanh nghiệp với độ tin cậy 95,44% ?1.2.4 Những nhân tố ảnh hưởng tới độ lớn của khoảng tin cậyĐộ biến thiên của dữ liệu Cỡ mẫu Mức độ tin cậy 1.3 Ước lượng về tỷ lệ của tổng thể chungGiả thiếtChỉ có hai biểu hiện định tínhTổng thể chung phân bố theo quy luật nhị thứcPhân bố chuẩn được sử dụngƯớc lượng khoảng tin cậyVí dụ 3: Ước lượng tỷ lệMột mẫu ngẫu nhiên gồm 400 cử tri, trong đó có 32 người bầu cử cho ứng cử viên A. Sử dụng khoảng tin cậy 95% để ước lượng tỷ lệ cho p.Ví dụ 4Sử dụng số liệu tại bảng 6.1 trang 254 hãy ước lượng tỷ lệ nhân viên trong doanh nghiệp có doanh thu 50 triệu đồng trở lên với độ tin cậy 95%.1.4 Xác định cỡ mẫuKhi chọn cỡ mẫuYêu cầu: sai số nhỏ; chí phí thấpKhi muốn ước lượng trung bình:Khi muốn ước lượng tỉ lệ :NỘI DUNG1. Ước lượng2. Kiểm định giả thuyết 3. So sánh trung bình, tỉ lệ hai mẫu2. Kiểm định giả thiết2.1 Kiểm định giả thiết là gì? Giả thiết thống kê và các loại giả thiết Quá trình kiểm định giả thiết Mức ý nghĩa và sai lầm trong việc ra quyết định2.2 Các bước kiểm định giả thiết2.3 Kiểm định giả thiết về giá trị trung bình Liên hệ giữa khoảng tin cây và kiểm định giả thiết2.4 Kiểm định giả thiết 2.1 Kiểm định Giả thiết là gì2.1.1 Các loại giả thiếtĐưa ra giả định (bằng số) để kiểm địnhVD: Giả sử rằng năng suất của công nhân trong một phân xưởng là 60sp/h .Bắt đầu với giả định rằng giả thiết “không” luôn luôn Đúng. Tương tư như khái niệm vô tội cho đến khi có bằng chứng chứng minh là có tộiLuôn có dấu “=” Giả thiết đối có thể hoặc không chấp nhận2.1.2 Quá trình kiểm định giả thiếtĐặt giả thiết “không” Đặt giả thiết đối Các giả thiết loại trừ lẫn nhau và bao hàm tất cả các trường hợp.Đôi khi điền giả thiết đối trước sẽ dễ dàng hơnThu thập thông tin về mẫu để rút ra kết luận về giả thiết cần kiểm định.2.1.2 Quá trình kiểm định giả thiếtBác bỏ H02.1.3 Mức ý nghĩa Là xác suất bác bỏ H0 khi nó đúngGọi là miền bác bỏ của phân bốLựa chọn giá trị (alpha)Các giá trị điển hình: 0.01, 0.05, 0.1Được chọn trước khi bắt đầu nghiên cứuĐưa ra những giá trị tới hạn cho kiểm địnhMức ý nghĩa và miền bác bỏ2.1.4 Những sai lầm trong ra quyết địnhLoại IBác bỏ giả thiết “Không” khi nó đúngGây ra hậu quả nghiêm trọngXác suất sai của loại I là Loại IIKhông loại bỏ giả thiết “không” khi nó saiXác suất xảy ra sai sót loại II là Những kết quả có thểHội đồng xét xử (H0 : vô tội)Tình huống thực tếTuyên ánVô tộiCó tộiVô tội (1-)Sai loại II (Có tộiSai loại I (Lực lượng kiểm định (1- có mối liên hệ ngược chiềuNhững nhân tố ảnh hưởng tới sai lầm loại II, Giá trị đúng của tham số tổng thể chungTăng khi chênh lệch giữa tham số kiểm định và giá trị đúng giảmMức ý nghĩa Tăng khi giảmĐộ lệch chuẩn của tổng thể chung Tăng khi tăngCỡ mẫu nTăng khi n giảm2.2 Các bước tiến hành kiểm địnhVD: Kiểm định với giả thiết năng suất lao động bình quân của công nhân ở phân xưởng A ít nhất là 60sp/ngày.1. Đặt giả thiết 2. Đặt giả thiết đối 3. Chọn 4. Chọn n=1005. Chọn tiêu chuẩn kiểm định Z (p, t ,)2.2 Các bước tiến hành kiểm định6. Thu thập dữ liệu: Điều tra năng suất lao động của 100 công nhân7. Tính toán các giá trị thống kê cần thiết theo tiêu chuẩn kiểm định đã lựa chọn8. Ra quyết định thống kê: bác bỏ giả thiết hay chấp nhận giả thiết đề ra9. Kết luận2.3 Kiểm định giả thiết về giá trị trung bình2.3.1 Kiểm định Z khi đã biết Thay đổi thống kê mẫu (VD ) sang biến Z chuẩn hóa Tiêu chuẩn kiểm địnhSo sánh với giá trị Z tới hạnNếu thống kê kiểm định Z trong miền tới hạn, bác bỏ H0 ; ngược lại thì không bác bỏ H0 a) Kiểm định Z một phíaGiả định chung phân bố chuẩnTổng thể chung: Phân bố chuẩnNếu không chuẩn, sử dụng mẫu lớnGiả thiết “không” chỉ có dấu hoặc Kiểm định Z:Miền bác bỏVí dụ 5Giám đốc một công ty sản xuất cà phê muốn kiểm tra khối lượng của mỗi gói sản phẩm có vượt quá khối lượng quy định là 300g hay không, với sai số cho phép trung bình là 15 gram. Để kiểm tra chất lượng của bộ phận đóng gói, ông lấy mẫu 25 gói cà phê, tính được khối lượng trung bình là 304 gram, với mức ý nghĩa 5%, có đủ cơ sở để kết luận là bộ phận đóng gói không hoàn thành nhiệm vụ hay không?Tìm giá trị tới hạnTính toán ra kết luậnn = 25 Giá trị tới hạn: Tiêu chuẩn kiểm địnhQuyết định: Không bác bỏ giả thuyết H0 Kết luận: Không có bằng chứng chứng tỏ 1 gói cà phê có khối lượng trung bình lớn hơn 300gVí dụ 6Một công ty có hệ thống máy móc sản xuất được 1200 sản phẩm trong 1 h. Công ty mới nhập một hệ thống mới. Để kiểm tra tính hiệu quả của hệ thống mới này, người ta chọn ngẫu nhiên 40 máy, cho thấy số sản phẩm trung bình được tạo ra trong 1 h là 1260 với độ lệch chuẩn là 215. Với mức ý nghĩa 5% hãy nhận định xe hệ thống mới có tốt hơn hệ thống cũ hay khôngb. Kiểm định Z hai phíaVí dụ :Một hộp ngũ cốc trung bình có chứa đúng 3.68 g? Lấy ngẫu nhiên một mẫu gồm 25 hộp và cho kết quả Công ty định rõ Kiểm định tại mức ý nghĩa Ví dụ (tiếp)n = 25 Giá trị tới hạn: Tiêu chuẩn kiểm địnhQuyết định: Không bác bỏ giả thuyết H0 Kết luận: Không có bằng chứng chứng tỏ 1 hộp ngũ cốc trung bình chứa khác 368g2.3.2 Kiểm định t khi chưa biết , mẫu nhỏ (n<30) Giả định:Tổng thể chung phân bố chuẩnNếu không chuẩn, chỉ lệch nhẹ và lấy cỡ mẫu lớnQuá trình kiểm định tham sốKiểm định tVD: Kiểm định 1 phíaMột hộp ngũ cốc trung bình có chứa hơn 368 gr? Lấy ngẫu nhiên một mẫu gồm 36 hộp và cho kết quả và S=15. Kiểm định với mức ý nghĩa Ví dụ (tiếp)n = 36 ; df = 35 Giá trị tới hạn: Tiêu chuẩn kiểm địnhQuyết định: Không bác bỏ giả thuyết H0 Kết luận: Không có bằng chứng chứng tỏ 1 hộp ngũ cốc trung bình chứa khác 368g2.4 Kiểm định tỷ lệLà một phân số hoặc % của tổng thể chng theo tiêu thức định tính nào đóNếu tiêu thức định có hai biểu hiện và phân bố theo quy luật nhị thứcBao gồm cả biểu hiện có và không có theo tiêu thức nghiên cứuTỷ lệ của tổng thể mẫu ()Sử dụng khi n đủ lớn () hoặc Kiểm định giả thiết về tỷ lệ của tổng thể chung – Kiểm định ZVD:Vấn đề: 1 công ty marketing cần phải nhận được 4% lời phúc đáp sau khi gửi thư qua đường bưu điện trước khi tiến hành điều tra trên toàn bộ quốc gia.Tiếp cận: Để kiểm định sự đòi hỏi này, điều tra một mẫu ngẫu nhiên gồm 500 đơn vị, trong đó có 25 lời phúc đápGiải pháp: Kiểm định tại mức ý nghĩa Ví dụ n = 25 Giá trị tới hạn: Tiêu chuẩn kiểm địnhQuyết định: Không bác bỏ giả thuyết H0 Kết luận: Chúng ta không có đủ bằng chứng để bác bỏ mục tiêu của công ty về tỷ lệ phúc đạp là 4%NỘI DUNG1. Ước lượng2. Kiểm định giả thuyết 3. So sánh hai tổng thể3. So sánh hai tổng thể3.1 Kiểm định giá trị trung bình của hai tổng thểHai mẫu độc lậpHai mẫu phụ thuộc3.2 Kiểm định tỷ lệ của hai tổng thể3.1 Kiểm định giá trị trung bình của hai tổng thể3.1.1 Hai mẫu độc lậpGiả xử nghiên cứu hai tổng thể) ; ) Chưa biết , nhưng có cơ sở để giả định chúng bằng nhau Để kiểm định giả thiết trên, lấy hai mẫu ngẫu nhiên độc lập với kích thước mẫu & có được T/h1: Biết phương sai của tổng thể chúng, hoặc mẫu lớn Biết phương sai tổng thể chungVí dụ 7Có ý kiến cho rằng chiều cao của nữ thanh niên sống ở khu vực thành thị cao hơn so với nữ thanh niên ở khu vực nông thôn, người ta tiến hành chọn 50 người sống ở khu vực thành thị và 50 người sống ở khu vực nông thôn. Thu được chiều cao trung bình lần lượt thu được tại 2 khu vực là 167,7 và 165,33 cm. Với xác suất 95% hãy đưa ra kết luận biết rằng độ lệch chuẩn ở 2 khu vực lần lượt là 2,5 cm và 2,8 cm.T/h2: Khi chưa biết phương sai nhưng giả sử chúng bằng nhauSử dụng tiêu chuẩn kiểm địnhTrong đóVD8Trở lại ví dụ 7. Chúng ta giả sử rằng giá trị trung bình về chiều cao của nữ sinh ở 2 khu vực là 167,7 cm và 165,33 cm và phương sai mẫu lần lượt là: 10.01 và 12.79. Với xác suất 95% hãy đưa ra kết luận liệu chiều cao trung bình của nữ sinh ở khu vực thành thị có cao hơn khu vực nông thôn hay không ?3.1.2 So sánh trung bình của hai mẫu phụ thuộcGiả sử nghiên cứu 2 tổng thể phụ thuộc) ; ) Muốn so sánh , chúng ta xét trung bình độ lệch = chưa biết, tuy nhiên có cơ sở để giả định nó bằng Để kiểm định giả thiết trên, lấy một mẫu ngẫu nhiên phụ thuộc được hình thành bởi n cặp quan sát độc lập của hai mẫu, tính là trung bình của các độ lệchLực chọn tiêu chuẩn kiểm định Ví dụ 9Người ta quảng cáo rằng những người tham gia chương trình luyện tập giảm cân trung bình sẽ giảm trên 8kg. Để chứng minh điều này họ đã phỏng vấn 10 người để ghi lại cân nặng của họ trước và sau chương trình. Số liệu thu được như sau:Với độ chính xác 95% hãy kiểm định lại giả thuyết trên72778479746774777989656877736661667171783.2 So sánh tỷ lệ của hai tổng thểGiả sử nghiên cứu hai tổng thể, tỉ lệ theo tiêu thức A trên hai tổng thể lần lượt là Chưa biết nhưng có cơ sở để giả định chúng bằng nhau Để kiểm định giả thuyết trên với điều kiên đủ lớn ( tương tự với Sử dụng tiêu chuẩn kiểm địnhTrong đó Ví dụNgười ta cho rằng phương pháp mới làm tỉ lệ nảy mầm cao hơn. Để kiểm tra, phương pháp cũ người ta kiểm tra 150 hạt thấy 140 hạt nảy mầm, phương pháp mới, kiểm tra 120 hạt thì thấy 111 hạt nảy mầm. Hãy kiểm tra với mức ý nghĩa 2%
Các file đính kèm theo tài liệu này:
- bai_giang_phan_tich_va_xu_ly_du_lieu_trong_kinh_doanh_chuong.pptx