Kinh tế học - Thu thập dữ liệu thống kê

XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP

V?n d? d?u tin c?a cơng vi?c thu th?p d? li?u:

- Xc d?nh r nh?ng d? li?u no c?n thu th?p

- th? t? uu tin c?a cc d? li?u ny.

pdf16 trang | Chia sẻ: Mr Hưng | Lượt xem: 907 | Lượt tải: 0download
Nội dung tài liệu Kinh tế học - Thu thập dữ liệu thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21/01/2015 1 THU THẬP DỮ LIỆU THỐNG KÊ 1 KHÁI QUÁT QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ: 2 Xác định mục đích, nội dung, đối tượng vấn đề nghiên cứu xây dựng hệ thống các khái niệm, chỉ tiêu thống kê. Điều tra thống kê Xử lý số liệu : - Tập hợp, sắp xếp số liệu. - Chọn các phần mềm xử lý số liệu. - Phân tích thống kê sơ bộ. Phân tích và giải thích kết quả. Dự đĩan xu hướng phát triển của hiện tượng Viết báo cáo và truyền đạt kết quả nghiên cứu XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP Vấn đề đầu tiên của cơng việc thu thập dữ liệu: - Xác định rõ những dữ liệu nào cần thu thập - thứ tự ưu tiên của các dữ liệu này. 3 4 Categorical (Qualitative) Discrete Continuous Numerical (Quantitative) Data 21/01/2015 2 - Phản ánh tính chất, sự hơn kém của các đối tượng nghiên cứu. - Thu thập bằng thang đo định danh hay thứ bậc - Ví dụ: Sv ở nhà cha mẹ, ở trọ, ktx hay ở nhà bà con người quen, - Phản ánh mức độ hay mức độ hơn kém - Thu thập bằng thang đo bằng thang đo khoảng cách hay thang đo tỉ lệ. - Ví dụ: Số lượng sinh viên của lớp K713QT. 1.SV của trường X cĩ đi làm thêm. 2.Số lượng SV đi làm thêm chiếm 35% 3.Thời gian làm thêm trung bình 12 giờ (3 buổi) mỗi tuần 4.Tính chất cơng việc ít liên quan đến ngành nghề đang được đào tạo 5.Mục đích chủ yếu của việc đi làm thêm là lý do kinh tế 6.Việc làm thêm cĩ ảnh hưởng đến kết quả học tập 7.Điểm trung bình học tập của SV đi làm thêm giảm bình quân là 0,3 điểm 7 Primary Data Collection Secondary Data Compilation Observation Experimentation Survey Print or Electronic 21/01/2015 3 Dữ liệu thu thập từ những nguồn cĩ sẵn, đĩ chính là những dữ liệu đã qua tổng hợp xử lý từ các cơ quan.  Ưu điểm -Thu thập nhanh, ít tốn kém chi phí Nhược điểm - Dữ liệu đơi khi ít chi tiết và khơng đáp ứng đúng nhu cầu nghiên cứu. 9 Nguồn dữ liệu thứ cấp : - Nội bộ: các số liệu báo cáo về tình hình kinh tế như sx, tiêu thụ, tài chính, nhân sự..của các phịng ban. - Cơ quan thống kê nhà nước: dữ liệu tổng quát về dân số, lao động, việc làm, giáo dục, mức sống dân cư, tài nguyên - Cơ quan chính phủ - Báo, tạp chí - Các tổ chức hiệp hội, viện nghiên cứu 10 Dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu. Ưu điểm - Dữ liệu chi tiết và đáp ứng đúng nhu cầu nghiên cứu Nhược điểm - Tốn kém chi phí và thời gian 11 12 phương pháp thu thập dữ liệu sơ cấp Nghiên cứu thực nghiệm Nghiên cứu quan sát - Khảo sát qua điện thoại -Thư hỏi và các dạng khảo sát viết khác - Quan sát trực tiếp và phỏng vấn cá nhân - PP thu thập khác 21/01/2015 4 13 ĐTTK Căn cứ vào t/c liên tục của việc thu thập thơng tin Căn cứ vào phạm vi tổng thể tiến hành điều tra Điều tra thường xuyên Điều tra khơng thường xuyên Điều tra tồn bộ Điều tra khơng tồn bộ Đ/t trọng điểm Đ/t chuyên đề Đ/t chọn mẫu Thu thập thơng tin liên tục theo thời gian, theo sát với quá trình biến động của hiện tượng nghiên cứu. VD : - Điều tra biến động nhân khẩu địa phương (sinh, tử, đi, đến) - Tình hình nhân cơng tại DN 14 Tiến hành thu thập thơng tin khơng liên tục  Phản ánh trạng thái của hiện tượng ở một thời điểm hay thời kỳ nhất định theo nhu cầu. Thường dùng cho các hiện tượng cần theo dõi thường xuyên. Chi phí điều tra lớn, hoặc các hiện tượng khơng cần theo dõi thường xuyên. 15 Tiến hành điều tra tất cả các đơn vị của tổng thể nên cịn gọi là tổng điều tra. VD : Tổng điều tra dân số Tổng điều tra nơng nghiệp Ưu điểm:cung cấp thơng tin đầy đủ về hiện tượng. Nhược điểm: chi phí cao về thời gian, nhân lực, chi phí. 16 21/01/2015 5 Thu thập thơng tin của một số đơn vị được chọn từ tổng thể chung. Mục đích : Cĩ thơng tin làm căn cứ nhận định hoặc suy rộng cho tổng thể chung. 17  Điều tra trọng điểm  Điều tra chuyên đề  Điều tra chọn mẫu 18 Chỉ tiến hành thu thập thơng tin ở bộ phận chủ yếu (bộ phận chiếm tỷ trọng lớn) của tổng thể chung. Kết quả điều tra khơng dùng để suy rộng cho tồn tổng thể nhưng giúp cho việc nắm được những đặc điểm cơ bản của hiện tượng. Thích hợp với những tổng thể cĩ các bộ phận tương đối tập trung, chiếm tỷ trọng lớn trong tổng thể. 19 Là điều tra trên một số ít các đơn vị của tổng thể nhưng lại đi sâu nghiên cứu nhiều khía cạnh của đơn vị đĩ. Thường dùng nghiên cứu những điển hình (tốt, xấu) để tìm hiểu nguyên nhân, rút kinh nghiệm Kết quả điều tra khơng dùng để suy rộng hoặc làm căn cứ đánh giá tình hình cơ bản của hiện tượng. 20 21/01/2015 6 Là tiến hành điều tra thu thập thơng tin trên một số đơn vị của tổng thể chung theo phương pháp khoa học sao cho các đơn vị này phải đại diện cho cả tổng thể chung đĩ. Kết quả điều tra dùng để suy rộng cho cả tổng thể chung. Ưu điểm : tiết kiệm thời gian ,chi phí và dữ liệu đáng tin cậy 21 Quota (định mức) Sample(Mẫu) Non-Probability Samples (Phi xác suất) Judgement (Phán đốn) Convenient (thuận tiện) Probability(Xác suất) Simple Random (ngẫu nhiên đơn giản) Systematic (hệ thống) Stratified (phân tầng) Cluster (cụm) 23 Chọn mẫu thuận tiện Chọn mẫu phán đốn Chọn mẫu định mức 24 Các đơn vị mẫu được chọn ở tại một địa điểm và vào một thời gian nhất định Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện” để chọn mẫu Chỉ dùng cho nghiên cứu thăm dị, trắc nghiệm, khơng dùng cho nghiên cứu mơ tả hay nhân quả vì tính đại diện khơng cao 21/01/2015 7 Vd: chọn mẫu những người đi mua sắm ở Metro CT và tiếp cận họ khi họ bước vào sthị hoặc khi họ mua sắm mĩn hàng mà ta muốn khảo sát. Ưu điểm: dễ dàng tập hợp các đơn vị mẫu Nhược điểm: khơng đạt được độ xác thực cao 25 26 Các đơn vị mẫu được chọn dựa vào sự phán đốn của người nghiên cứu mà họ nghĩ rằng những mẫu này cĩ thể đại diện cho tổng thể Cách chọn mẫu này được dùng phổ biến khi nghiên cứu định tính Ví dụ: Chọn mẫu một số ít liên doanh lớn cĩ thể chiếm phần lớn tổng sản lượng ngành cơng nghiệp cả nước. Ưu điểm: chọn đúng phần tử rất quan trọng của tổng thể Nhược điểm: cĩ khả năng phát sinh những sai lệch lớn 27 28 Là chọn mẫu theo tỷ lệ gần đúng của các nhĩm đại diện trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhĩm Tổng thể quá lớn, sự khác biệt (biến động) giữa các phần tử khơng lớn Tổng thể đã được phân tổ nhĩm trước (đồng nhất) PVV chỉ cần chọn cho đủ số lượng khơng cần ngẫu nhiên Ưu điểm: đảm bảo được số mẫu cần thiết cho từng nhĩm trong tổng thể phục vụ khách hàng Nhược điểm: cĩ thể cho kết quả sai lệch 21/01/2015 8  Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để so sánh kết quả thống kê về thái độ khách hàng. Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đĩ 600 c.ty vừa và nhỏ, 300 trung bình và 100 qui mơ lớn. Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 c.ty vừa và nhỏ, 30 trung bình và 10 c.ty lớn  Vd: ý thức tham gia giao thơng của SV ĐHCT (cĩ thể chọn bất kỳ sinh viên nam nữ nào vì trong trường hợp này thì giới tính khơng cĩ sự khác biệt lớn) 29 30 Dựa vào lý thuyết xác suất để lấy mẫu ngẫu nhiên Một số cách chọn mẫu xác suất  Chọn mẫu ngẫu nhiên đơn giản  Chọn mẫu cĩ hệ thống  Chọn mẫu ngẫu nhiên phân tầng  Chọn mẫu cả cụm 31 Là cách chọn mẫu mà mỗi phần tử trong tổng thể cĩ cùng cơ hội được chọn với xác suất như nhau. Để chọn được mẫu, người NC phải cĩ danh sách tổng thể NC Vd: Chọn ngẫu nhiên 100 mẫu sinh viên trong tổng số 4.000 sinh viên Khoa Kinh Tế & QTKD. 32  Chọn ngẫu nhiên mẫu đầu tiên.  Sau đĩ dùng bước nhảy (lặp đi lặp lại) Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu nhiên (giảm sai lệch do tuần hồn bước nhảy) Vd: PV các hộ gia đình vùng nơng thơn 21/01/2015 9 33  Là phân chia các đối tượng nghiên cứu thành các nhĩm, tầng theo các đặc tính, sau đĩ lấy mẫu theo tầng, nhĩm.  Chia tổng thể ra từng nhĩm nhỏ theo 1 tiêu thức nào đĩ gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, TĐHV, nhân khẩu,).  Chọn ngẫu nhiên hay hệ thống trong từng nhĩm phân tầng theo tỷ lệ với nhĩm.  Ưu điểm: Phổ biến nhất vì tính chính xác và đại diện cao. 34 Xác suất Phi xác suât Ưu điểm Tính đại diện cao. Khái quát hĩa cho tổng thể. Tiết kiệm thời gian và chi phí. Nhược điểm Tốn kém thời gian và chi phí. Tính đại diện thấp. Phạm vi sử dụng Nghiên cứu mơ tả, nhân quả và khám phá. Nghiên cứu thăm dị, thử nghiệm. Basic Business Statistics, 8e © 2002 Prentice-Hall, Inc. Chap 1-35  Every individual or item from the frame has an equal chance of being selected  Selection may be with replacement or without replacement  Samples obtained from table of random numbers or computer random number generators Decide on sample size: n Divide frame of N individuals into groups of k individuals: k=n/n Randomly select one individual from the 1st group  Select every k-th individual thereafter N = 64 n = 8 k = 8 First Group 21/01/2015 10  Population divided into two or more groups according to some common characteristic  Simple random sample selected from each group The two or more samples are combined into one Basic Business Statistics, 8e © 2002 Prentice-Hall, Inc. Chap 1-38  Population divided into several “clusters,” each representative of the population  Simple random sample selected from each The samples are combined into one Population divided into 4 clusters.  Simple random sample and systematic sample  Simple to use  May not be a good representation of the population’s underlying characteristics  Stratified sample  Ensures representation of individuals across the entire population Cluster sample  More cost effective  Less efficient (need larger sample to acquire the same level of precision) Kế hoạch điều tra là gì ? - Là một tài liệu dưới dạng văn bản: + đề cập những vấn đề hoặc cần được hiểu + thống nhất, trình tự và phương pháp tiến hành cuộc điều tra. + những vấn đề thuộc về chuẩn bị và tổ chức tồn bộ cuộc điều tra. 21/01/2015 11 - Mơ tả mục đích điều tra - Xác định đối tượng điều tra và đơn vị điều tra - Nội dung điều tra (mục lục các tiêu thức cần thu thập dữ liệu trên các đơn vị điều tra) - Xác định thời điểm thời kì điều tra. - Biểu điều tra và bảng giải thích cách ghi biểu 41 42 1 MỤC TIÊU Giúp đáp viên hiểu đúng nội dung câu hỏi. Động viên, tranh thủ sự cộng tác. Hướng dẫn cách trả lời. Tối thiểu các sai sĩt cĩ thể xảy ra khi đáp viên trả lời. 43 2 NỘI DUNG BẢN CÂU HỎI Phần giới thiệu Giới thiệu bản thân phỏng vấn viên. Giới thiệu lý do, mục đích nghiên cứu. Khoảng thời gian cần thiết để hồn thành. 44 2 NỘI DUNG BẢN CÂU HỎI Phần sàng lọc Chọn đúng đối tượng để thu dữ liệu. Thường dùng BCH phân đơi. Phần nội dung chính Đa số câu hỏi liên quan đến nội dung NC. Phần quản lý: xác nhận, lời cam đoan, mẫu số. 21/01/2015 12 45 Phần giới thiệu Xin chào, tơi là thuộc nhĩm nghiên cứu . Chúng tơi đang thực hiện đề tài. Anh (chị) vui lịng dành chút thời gian khoảng để giúp chúng tơi trả lời một số câu hỏi dưới đây. Chúng tơi rất hoan nghênh sự cộng tác và giúp đỡ của anh (chị). Các ý kiến trả lời của anh (chị) sẽ được đảm bảo giữ bí mật tuyệt đối. 46 Nghiên cứu số Vùng, địa phương Bảng câu hỏi Phỏng vấn viên Phỏng vấn lúc Thời gian phỏng vấn Giám sát viên Kết luận của GSV Kiểm tra viên Kết quả kiểm tra Tên người trả lời Địa chỉ Điện thoại 47 1 Xác định thơng tin cần thiết Dự án nghiên cứu Bảng câu hỏi Nhĩm người trả lời Danh mục các thơng tin cần cĩ Các câu hỏi cần được chi tiết Các dữ liệu cần thu thập Vd: năng suất lúa Sản lượng từng vụ Diện tích từng vụ Sản lượng đã thu hoạch Diện tích gieo trồng 48 2 XÁC ĐỊNH HÌNH THỨC PHỎNG VẤN • Thư tín: tiện lợi, chi phí thấp nhưng tỷ lệ trả lời thấp, khĩ xác định độ tin cậy của thơng tin được thu thập. • Điện thoại: tốn kém, chỉ áp dụng khi thu thập ít thơng tin và thời gian phỏng vấn ngắn; thơng tin tương đối tin cậy • Trực tiếp: thơng tin tin cậy, tỷ lệ trả lời cao nhưng tốn kém 21/01/2015 13 49 3 LỰA CHỌN CẤU TRÚC CÂU HỎI Câu hỏi MỞ: • Phần trả lời khơng định trước, đáp viên tự trả lời theo suy nghĩ • Khai thác ý kiến mới. • Tạo quan hệ mật thiết khi trả lời. • Khĩ tập hợp, mã hĩa, phân tích. • Khơng phù hợp với phỏng vấn bằng thư tín. • Khĩ khăn khi đáp viên trả lời dài dịng, lạc đề. 50 3 LỰA CHỌN CẤU TRÚC CÂU HỎI Câu hỏi ĐĨNG: Câu trả lời được soạn sẵn, đáp viên chỉ chọn những trả lời sẵn cĩ. Ví dụ: •Ơng (bà) trồng lúa theo mơ hình 3g3t 1. Cĩ (tiếp tục) 2. Khơng (tạm dừng) •Ơng (bà) gặp những khĩ khăn nào trong canh tác lúa? Vốn  Lao động  Cơng nghệ  Thời tiết  51 4 TỪ NGỮ SỬ DỤNG TRONG BCH • Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ: Who, What, Where, When, Why, How. • Sử dụng từ ngữ đơn giản, thơng dụng. • Tránh dùng từ ngữ trừu tượng. (Vd: đi sthị cĩ thường khơng?) • Tránh dùng câu hỏi cĩ 2 vế song song (vừa - vừa). • Cẩn thận câu hỏi liên quan đến tự ái cá nhân. (hỏi về trình độ,..). • Ý nghĩa từ ngữ được sử dụng? Cĩ nghĩa nào khác khơng? • Từ đồng âm khác nghĩa. • Từ địa phương (vd: lợn-heo, trà-chè,) 52 5 ĐIỀU CHỈNH BCH • Tiến hành điều tra thử (pretest, pilot survey) • Bổ sung, chỉnh sửa nếu cĩ • Những cuộc phỏng vấn mơ phỏng. • Câu trả lời khơng đầy đủ, lạc đề, sai nội dung, khơng đọc được. • Hiệu chỉnh sai sĩt thơng qua các BCH khác. • Dùng viết khác màu để chỉnh sửa. • Thống nhất nguyên tắc chỉnh lý chung. 21/01/2015 14 53 6 NHẬP SỐ LIỆU • Mã hĩa các câu hỏi và trả lời trước khi nhập. • Soạn thảo các tập tin mơ tả việc mã hĩa để phục vụ cho việc đọc số liệu trong tập tin dữ liệu. • Nhập số liệu vào máy tính, các phần mềm xử lý bảng tính: Excel, SPSS, Stata, Limdep, • Kiểm tra độ chính xác của việc nhập: so sánh ngẫu nhiên một số mẫu; tổ chức nhiều người nhập liệu song song, 54 7 XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU • Mã hĩa các câu hỏi và trả lời trước khi nhập. • Soạn thảo các tập tin mơ tả việc mã hĩa để phục vụ cho việc đọc số liệu trong tập tin dữ liệu. • Nhập số liệu vào máy tính, các phần mềm xử lý bảng tính: Excel, SPSS, Stata, Limdep, • Kiểm tra độ chính xác của việc nhập: so sánh ngẫu nhiên một số mẫu; tổ chức nhiều người nhập liệu song song, 55 i. Phân tích thống kê mơ tả Độ tập trung: mean, mode, median. Độ phân tán:phương sai, độ lệch chuẩn, dãy biến động, hệ số biến động. ii. Phân tích tần số: đếm tần số xuất hiện, đồ thị phân phối tần số. iii. Phân tích phương sai: một chiều, nhiều chiều iv. Phân tích hồi quy tương quan, 56 Những câu hỏi cần trả lời Các bước cần thực hiện Các cơng việc chính trong mỗi bước Các số liệu đã được thu thập cho mỗi mục tiêu NC là gì? Số liệu cĩ hồn chỉnh và chính xác khơng? Chuẩn bị số liệu cho phân tích -Xem xét lại việc thu thập tại thực địa, -Lập bảng kiểm kê các số liệu cho mỗi mục tiêu, -Xếp thứ tự các số liệu và kiểm tra chất lượng, -Kiểm tra output của máy tínhCác số liệu trơng như thế nào? Các số liệu cĩ thể được tĩm tắt như thế nào cho phân tích đơn giản? Tĩm tắt số liệu và mơ tả các biến/xác định biến mới Bảng tần suất, biểu đồ, biểu đồ phát triển, tỷ trọng, tần suất chéo, hệ số tương quan, các thống kê mơ tả, 21/01/2015 15 57 Sự tương quan giữa các biến số được xác định như thế nào? Phân tích sự tương quan -Bảng tần suất chéo, -Đo lường sự tương quan, -Xử lý các biến nhiễu. Cĩ đo lường sự chênh lệch hay tương quan giữa các biến khơng? Chuẩn bị cho phân tích thống kê - Các đo lường sự phân tán, phân phối chuẩn và sự biến động mẫu Xác định loại của phân tích thống kê - Lựa chọn các kiểm định về mức ý nghĩa Làm thế nào sự khác biệt giữa các nhĩm cĩ thể được xác định? Phân tích các quan sát theo cặp và lẻ T-test, chi-square test paired t-test Mc-Nemar’s chi-square test Làm thế nào sự tương quan giữa các biến cĩ thể được xác định? Thực hiện các đo lường về sự tương quan Biểu đồ phân tán, Đường hồi quy, và Hệ số tương quan 58 Báo cáo nên được viết như thế nào? Viết báo cáo và xây dựng các kiến nghị -Chuẩn bị dàn ý của báo cáo, -Trình bày và diễn dịch số liệu, -Bản nháp và bản nháp lần 2. -Thảo luận và tĩm tắt kết luận -Xây dựng kiến nghị Những kết quả và kiến nghị nên được cơng bố và sử dụng như thế nào? Trình bày tĩm tắt và bản nháp cho việc thực hiện các kiến nghị Thảo luận những tĩm tắt và kế hoạch thực hiện đối với những người liên quan  Sai số do đăng kí: sai số này phát sinh do việc ghi chép tài liệu khơng chính xác , do khai báo sai,..  Sai số do tính chất đại biểu: sai số này chỉ xảy ra trong điều tra khơng tồn bộ, đặc biệt là điều tra chọn mẫu. 59 + Làm tốt cơng tác chuẩn bị điều tra + Theo dõi, kiểm tra quá trình điều tra. + Làm tốt cơng tác tuyên truyền vận động 60 21/01/2015 16 Coverage error Non response error  Sampling error Measurement error Excluded from frame. Follow up on non responses. Chance differences from sample to sample. Bad Question!

Các file đính kèm theo tài liệu này:

  • pdfthong_ke_kinh_techuong2_8992.pdf