Một câu hỏi luôn đặt ra với nhà nghiên cứu là cần phải điều tra bao nhiêu đơn vị mẫu để nó đại diện và có thể suy rộng cho tổng thể, để phân tích có ý nghĩa và kết quả nghiên cứu có giá trị về mặt khoa học?
27 trang |
Chia sẻ: Mr Hưng | Lượt xem: 827 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Toán học - Cỡ mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Cỡ mẫuTại sao phải tính cỡ mẫuMột câu hỏi luôn đặt ra với nhà nghiên cứu là cần phải điều tra bao nhiêu đơn vị mẫu để nó đại diện và có thể suy rộng cho tổng thể, để phân tích có ý nghĩa và kết quả nghiên cứu có giá trị về mặt khoa học?Làm thế nào để xác định cỡ mẫu?Một cách đơn giản và dễ nhất là dựa vào các nghiên cứu có cùng nội dung đã được thực hiện trước đó để lấy mẫu.Có thể hỏi ý kiến các chuyên gia, những người có kinh nghiệm thực hiện các dự án điều tra khảo sát.Có thể tính toán theo công thức tính mẫu.Công thức tính cỡ mẫuVới trường hợp cỡ mẫu lớn và không biết tổng thể.Tính cỡ mẫuTrong đó: n= là cỡ mẫu z= giá trị phân phối tương ứng với độ tin cậy lựa chọn (nếu độ tin cậy 95% thì giá trị z là 1,96) p= là ước tính tỷ lệ % của tổng thể q = 1-p thường tỷ lệ p và q được ước tính 50%/50% đó là khả năng lớn nhất có thể xảy ra của tổng thể. e = sai số cho phép (+-3%, +-4%,+-5%...)Ví dụTính cỡ mẫu của một cuộc trưng cầu ý kiến trước một cuộc bầu cử với độ tin cậy là 95% với giá trị z tương ứng là 1.96, sai số cho phép là nằm trong khoảng +5%. Giả định p*q lớn nhất có thể xảy ra là 0.5*0.5.Cỡ mẫu sẽ được tính là:Cỡ mẫuTính cỡ mẫuTiếpỞ đó N = số lượng đơn vị trong tổng thể. P = tỷ lệ tổng thể.Q = 1-P, k= sai số cho phép.Tính cỡ mẫuNếu tổng thể nhỏ và biết được tổng thể thì dùng công thức sau: Với n là cỡ mẫu, N là số lượng tổng thể, e là sai số tiêu chuẩn Ví dụTính cỡ mẫu của một cuộc điều tra vớiTổng thể là N= 2000, độ chính xác là 95%, sai số tiêu chuân là +- 5%.-- cỡ mẫu sẽ được tính là:Ví dụBảng cỡ mẫu Bảng 1. Cỡ mẫu với sai số cho phép là ±3%, ±5%, ±7% và ±10% Độ tin cậy là 95% và P=0.5. Cỡ của tổng thểCỡ mẫu(n) với sai số cho phép : ±3% ±5% ±7% ±10% 500*22214583600*24015286700*25515888800*26716389900*277166901,000*286169912,00071433318595Bảng cỡ mẫu (tiếp)Bảng 1. Cỡ mẫu với sai số cho phép là ±3%, ±5%, ±7% và ±10% Độ tin cậy là 95% và P=0.5. Cỡ của tổng thểCỡ mẫu(n) với sai số cho phép : ±3% ±5% ±7% ±10% 3,000811 353191974,000870364194985,000909 370196986,000938375197987,000959378198998,000976381199999,00098938320099Bảng cỡ mẫu (tiếp)Bảng 1. Cỡ mẫu với sai số cho phép là ±3%, ±5%, ±7% và ±10% Độ tin cậy là 95% và P=0.5. Cỡ của tổng thểCỡ mẫu(n) với sai số cho phép : ±3% ±5% ±7% ±10% 10,0001,0003852009915,0001,0343902019920,0001,053 39220410050,0001,087397204100100,0001,099398204100>100,0001,111400204100Trọng sốTrọng sốCó nhiều cuộc điều tra bạn phải sử dụng trọng số trong phân tích dữ liệu.Trọng số này phải được tính toán.Bạn cần phải hiểu rõ về trọng số này.Mục đích sử dụng trọng số: đại diện cho tổng thể tốt hơn.Trọng sốTrong số được tính bằng phân số nghịch đảo của phân số chọn mẫu:W= N/nTại sao lại sử dụng trọng sốChọn mẫu phân tầng không tỷ lệ.Hiệu chỉnh với những trường hợp không trả lời điều tra.Hiệu chỉnh với thiết kế mẫu mà xác suất lựa chọn đơn vị mẫu không ngang nhau.Trong hậu phân tầng.Ví dụ: Nếu đơn vị điều tra X có khả năng được lựa chọn bằng một nửa đơn vị Y có, thì đơn vị X sẽ có trọng số là 2 để có cơ hội bằng đơn vị Y.Ví dụTrong ví dụ về lựa chọn 100 sinh viên trong đó có 50 sinh viên dân tộc kinh và 50 sinh viên dân tộc thiểu số từ mẫu 2000 sinh viên với 100 sinh viên dân tộc thiểu số.Như vậy sinh viên xác suất lựa chọn của sinh viên dân tộc thiểu số là ½ trong khi của dân tộc kinh là 1/38. Để phù hợp với sự phân bố tỷ lệ của tổng thể, ta phải sử dụng trọng số.Trọng sốVới ví dụ trên, thì phân tầng nhóm sinh viên dân tộc kinh sẽ có trọng số là 38 và sinh viên dân tộc thiểu số sẽ có trọng số là 2. Ví dụTổng thể: 2500 hộ gia đình thuộc nhóm nghèo và 1200 hộ gia đình thuộc nhóm giàu.Một cuộc điều tra được thực hiện với 2 phân tầng: phân tầng hộ giàu và phân tầng hộ nghèo.Mỗi phân tầng lựa chọn 100 hộ gia đình.Mẫu đã lựa chọn nhiều hơn so với tỷ lệ của phân tầng hộ giàu.Ví dụNếu chúng ta tính trung bình thu nhập của hộ gia đình theo mẫu thì thu nhập quá cao so với thực tế.Để ước lượng thu nhập trung bình của dân cư không bị sai lệch, chúng ta cần gia trọng khu vực hộ giàu thấp ít hơn khu vực hộ nghèo. Việc này có thể thực hiện dễ dàng với Stata.Ví dụ.Giả thiết rằng, trung bình thu nhập của nhóm hộ nghèo là 12000$, và của nhóm hộ giàu là 25000$. Trung bình thu nhập không có trọng số: {100 x 12000$+100 x 25000$}/200=$18,500Trung bình có trọng số: - Trọng số nhóm hộ nghèo: W1= 2500/100=25 - Trọng số nhóm hộ giàu: W2= 1200/100=12 - {100 x 1200$ x 25 + 100 x 2500$ x 12}/ {100 x 25+ 100 x 12}= 16,216.20$Chúng ta có thể thấy rằng thực hiện gia trọng sẽ chính xác hơn so với thực tế vì trong mẫu có quá nhiều hộ thuộc phân tầng hộ giàu.Bài tập Một cuộc khảo sát các nhà đầu tư chứng khoán với số lượng là 1000 nhà đầu tư. Thu được kết quả như sau: 100 nhà đầu tư có vốn <100 triệu đồng. 300 nhà đầu tư có vốn từ 100-500tr đồng. 600 nhà đầu tư cố vốn từ 500tr trở lên. Bài tậpKhi lấy thông tin từ ủy ban chứng khoán quốc gia thì thấy tỷ lệ phân bố như sau:20% nhà đầu tư có vốn < 100tr đồng60% nhà đầu tư có vốn 100-500tr đồng.20% nhà đầu tư có vốn <500tr đồng.Hãy tính trọng số kết quả thu được để số liệu phù hợp với thực tế?Bài tập Đề tài: Tìm hiểu nhu cầu tiêu dùng thực phẩm an toàn của người dân Hà Nội.Xây dựng kế hoạch thực hiện của đề tài trên.
Các file đính kèm theo tài liệu này:
- phan_4_5437.ppt