XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP
V?n d? d?u tin c?a cơng vi?c thu th?p d? li?u:
- Xc d?nh r nh?ng d? li?u no c?n thu th?p
- th? t? uu tin c?a cc d? li?u ny.
16 trang |
Chia sẻ: Mr Hưng | Lượt xem: 907 | Lượt tải: 0
Nội dung tài liệu Kinh tế học - Thu thập dữ liệu thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21/01/2015
1
THU THẬP DỮ LIỆU THỐNG KÊ
1
KHÁI QUÁT QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ:
2
Xác định mục đích, nội dung, đối tượng vấn đề nghiên cứu
xây dựng hệ thống các khái niệm, chỉ tiêu thống kê.
Điều tra thống kê
Xử lý số liệu :
- Tập hợp, sắp xếp số liệu.
- Chọn các phần mềm xử lý số liệu.
- Phân tích thống kê sơ bộ.
Phân tích và giải thích kết quả. Dự đĩan xu hướng phát
triển của hiện tượng
Viết báo cáo và truyền đạt kết quả nghiên cứu
XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP
Vấn đề đầu tiên của cơng việc thu thập dữ liệu:
- Xác định rõ những dữ liệu nào cần thu thập
- thứ tự ưu tiên của các dữ liệu này.
3 4
Categorical
(Qualitative)
Discrete Continuous
Numerical
(Quantitative)
Data
21/01/2015
2
- Phản ánh tính chất, sự hơn kém của các đối
tượng nghiên cứu.
- Thu thập bằng thang đo định danh hay thứ
bậc
- Ví dụ: Sv ở nhà cha mẹ, ở trọ, ktx hay ở
nhà bà con người quen,
- Phản ánh mức độ hay mức độ hơn kém
- Thu thập bằng thang đo bằng thang đo
khoảng cách hay thang đo tỉ lệ.
- Ví dụ: Số lượng sinh viên của lớp K713QT.
1.SV của trường X cĩ đi làm thêm.
2.Số lượng SV đi làm thêm chiếm 35%
3.Thời gian làm thêm trung bình 12 giờ (3 buổi) mỗi
tuần
4.Tính chất cơng việc ít liên quan đến ngành nghề đang
được đào tạo
5.Mục đích chủ yếu của việc đi làm thêm là lý do kinh
tế
6.Việc làm thêm cĩ ảnh hưởng đến kết quả học tập
7.Điểm trung bình học tập của SV đi làm thêm giảm
bình quân là 0,3 điểm
7
Primary
Data Collection
Secondary
Data Compilation
Observation
Experimentation
Survey
Print or Electronic
21/01/2015
3
Dữ liệu thu thập từ những nguồn cĩ sẵn,
đĩ chính là những dữ liệu đã qua tổng
hợp xử lý từ các cơ quan.
Ưu điểm
-Thu thập nhanh, ít tốn kém chi phí
Nhược điểm
- Dữ liệu đơi khi ít chi tiết và khơng đáp
ứng đúng nhu cầu nghiên cứu.
9
Nguồn dữ liệu thứ cấp :
- Nội bộ: các số liệu báo cáo về tình hình
kinh tế như sx, tiêu thụ, tài chính, nhân
sự..của các phịng ban.
- Cơ quan thống kê nhà nước: dữ liệu tổng
quát về dân số, lao động, việc làm, giáo
dục, mức sống dân cư, tài nguyên
- Cơ quan chính phủ
- Báo, tạp chí
- Các tổ chức hiệp hội, viện nghiên cứu
10
Dữ liệu thu thập trực tiếp, ban đầu từ đối
tượng nghiên cứu.
Ưu điểm
- Dữ liệu chi tiết và đáp ứng đúng nhu cầu
nghiên cứu
Nhược điểm
- Tốn kém chi phí và thời gian
11 12
phương pháp
thu thập dữ liệu sơ cấp
Nghiên cứu thực nghiệm
Nghiên cứu quan sát
- Khảo sát qua điện thoại
-Thư hỏi và các dạng khảo sát viết khác
- Quan sát trực tiếp và phỏng vấn cá nhân
- PP thu thập khác
21/01/2015
4
13
ĐTTK
Căn cứ vào t/c liên tục
của việc thu thập thơng tin
Căn cứ vào phạm vi
tổng thể tiến hành điều tra
Điều tra
thường xuyên
Điều tra khơng
thường xuyên
Điều tra
tồn bộ
Điều tra khơng
tồn bộ
Đ/t
trọng
điểm
Đ/t
chuyên
đề
Đ/t
chọn
mẫu
Thu thập thơng tin liên tục theo thời gian, theo sát
với quá trình biến động của hiện tượng nghiên cứu.
VD : - Điều tra biến động nhân khẩu địa phương
(sinh, tử, đi, đến)
- Tình hình nhân cơng tại DN
14
Tiến hành thu thập thơng tin khơng liên tục
Phản ánh trạng thái của hiện tượng ở một thời
điểm hay thời kỳ nhất định theo nhu cầu.
Thường dùng cho các hiện tượng cần theo dõi
thường xuyên.
Chi phí điều tra lớn, hoặc các hiện tượng khơng
cần theo dõi thường xuyên.
15
Tiến hành điều tra tất cả các đơn vị của tổng thể
nên cịn gọi là tổng điều tra.
VD :
Tổng điều tra dân số
Tổng điều tra nơng nghiệp
Ưu điểm:cung cấp thơng tin đầy đủ về hiện tượng.
Nhược điểm: chi phí cao về thời gian, nhân lực,
chi phí.
16
21/01/2015
5
Thu thập thơng tin của một số đơn vị được chọn từ
tổng thể chung.
Mục đích :
Cĩ thơng tin làm căn cứ nhận định hoặc suy rộng cho
tổng thể chung.
17
Điều tra trọng điểm
Điều tra chuyên đề
Điều tra chọn mẫu
18
Chỉ tiến hành thu thập thơng tin ở bộ phận chủ yếu
(bộ phận chiếm tỷ trọng lớn) của tổng thể chung.
Kết quả điều tra khơng dùng để suy rộng cho
tồn tổng thể nhưng giúp cho việc nắm được
những đặc điểm cơ bản của hiện tượng.
Thích hợp với những tổng thể cĩ các bộ phận
tương đối tập trung, chiếm tỷ trọng lớn trong tổng
thể.
19
Là điều tra trên một số ít các đơn vị của tổng thể
nhưng lại đi sâu nghiên cứu nhiều khía cạnh của
đơn vị đĩ.
Thường dùng nghiên cứu những điển hình (tốt,
xấu) để tìm hiểu nguyên nhân, rút kinh nghiệm
Kết quả điều tra khơng dùng để suy rộng hoặc
làm căn cứ đánh giá tình hình cơ bản của hiện
tượng.
20
21/01/2015
6
Là tiến hành điều tra thu thập thơng tin trên một số đơn
vị của tổng thể chung theo phương pháp khoa học sao
cho các đơn vị này phải đại diện cho cả tổng thể chung
đĩ.
Kết quả điều tra dùng để suy rộng cho cả tổng thể chung.
Ưu điểm : tiết kiệm thời gian ,chi phí và dữ liệu đáng tin
cậy
21
Quota (định mức)
Sample(Mẫu)
Non-Probability
Samples (Phi xác
suất)
Judgement
(Phán đốn)
Convenient (thuận
tiện)
Probability(Xác suất)
Simple Random
(ngẫu nhiên đơn giản)
Systematic (hệ thống)
Stratified
(phân tầng)
Cluster
(cụm)
23
Chọn mẫu thuận tiện
Chọn mẫu phán đốn
Chọn mẫu định mức
24
Các đơn vị mẫu được chọn ở tại một địa điểm
và vào một thời gian nhất định
Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận
tiện” để chọn mẫu
Chỉ dùng cho nghiên cứu thăm dị, trắc nghiệm,
khơng dùng cho nghiên cứu mơ tả hay nhân
quả vì tính đại diện khơng cao
21/01/2015
7
Vd: chọn mẫu những người đi mua sắm ở
Metro CT và tiếp cận họ khi họ bước vào
sthị hoặc khi họ mua sắm mĩn hàng mà ta
muốn khảo sát.
Ưu điểm: dễ dàng tập hợp các đơn vị mẫu
Nhược điểm: khơng đạt được độ xác thực
cao
25 26
Các đơn vị mẫu được chọn dựa vào sự
phán đốn của người nghiên cứu mà họ
nghĩ rằng những mẫu này cĩ thể đại diện
cho tổng thể
Cách chọn mẫu này được dùng phổ biến
khi nghiên cứu định tính
Ví dụ: Chọn mẫu một số ít liên doanh lớn
cĩ thể chiếm phần lớn tổng sản lượng
ngành cơng nghiệp cả nước.
Ưu điểm: chọn đúng phần tử rất quan
trọng của tổng thể
Nhược điểm: cĩ khả năng phát sinh những
sai lệch lớn
27 28
Là chọn mẫu theo tỷ lệ gần đúng của các nhĩm đại diện
trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi
nhĩm
Tổng thể quá lớn, sự khác biệt (biến động) giữa các
phần tử khơng lớn
Tổng thể đã được phân tổ nhĩm trước (đồng nhất) PVV
chỉ cần chọn cho đủ số lượng khơng cần ngẫu nhiên
Ưu điểm: đảm bảo được số mẫu cần thiết cho từng
nhĩm trong tổng thể phục vụ khách hàng
Nhược điểm: cĩ thể cho kết quả sai lệch
21/01/2015
8
Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải
khát để so sánh kết quả thống kê về thái độ khách
hàng. Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đĩ
600 c.ty vừa và nhỏ, 300 trung bình và 100 qui mơ lớn.
Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60
c.ty vừa và nhỏ, 30 trung bình và 10 c.ty lớn
Vd: ý thức tham gia giao thơng của SV ĐHCT (cĩ thể
chọn bất kỳ sinh viên nam nữ nào vì trong trường hợp
này thì giới tính khơng cĩ sự khác biệt lớn)
29 30
Dựa vào lý thuyết xác suất để lấy mẫu ngẫu
nhiên
Một số cách chọn mẫu xác suất
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu cĩ hệ thống
Chọn mẫu ngẫu nhiên phân tầng
Chọn mẫu cả cụm
31
Là cách chọn mẫu mà mỗi phần tử trong
tổng thể cĩ cùng cơ hội được chọn với
xác suất như nhau. Để chọn được mẫu,
người NC phải cĩ danh sách tổng thể NC
Vd: Chọn ngẫu nhiên 100 mẫu sinh viên
trong tổng số 4.000 sinh viên Khoa Kinh
Tế & QTKD.
32
Chọn ngẫu nhiên mẫu đầu tiên.
Sau đĩ dùng bước nhảy (lặp đi lặp lại)
Áp dụng tốt nếu danh sách tổng thể được xếp
ngẫu nhiên (giảm sai lệch do tuần hồn bước
nhảy)
Vd: PV các hộ gia đình vùng nơng thơn
21/01/2015
9
33
Là phân chia các đối tượng nghiên cứu thành các
nhĩm, tầng theo các đặc tính, sau đĩ lấy mẫu
theo tầng, nhĩm.
Chia tổng thể ra từng nhĩm nhỏ theo 1 tiêu thức
nào đĩ gọi là tiêu thức phân tầng (thu nhập, giới
tính, tuổi tác, TĐHV, nhân khẩu,).
Chọn ngẫu nhiên hay hệ thống trong từng nhĩm
phân tầng theo tỷ lệ với nhĩm.
Ưu điểm: Phổ biến nhất vì tính chính xác và đại
diện cao.
34
Xác suất Phi xác suât
Ưu điểm Tính đại diện cao.
Khái quát hĩa cho
tổng thể.
Tiết kiệm thời gian
và chi phí.
Nhược điểm Tốn kém thời gian và
chi phí.
Tính đại diện thấp.
Phạm vi sử dụng Nghiên cứu mơ tả,
nhân quả và khám
phá.
Nghiên cứu thăm
dị, thử nghiệm.
Basic Business Statistics, 8e © 2002
Prentice-Hall, Inc.
Chap 1-35
Every individual or item from the frame has
an equal chance of being selected
Selection may be with replacement or
without replacement
Samples obtained from table of random
numbers or computer random number
generators
Decide on sample size: n
Divide frame of N individuals into groups of k
individuals: k=n/n
Randomly select one individual from the 1st group
Select every k-th individual thereafter
N = 64
n = 8
k = 8
First Group
21/01/2015
10
Population divided into two or more groups
according to some common characteristic
Simple random sample selected from each group
The two or more samples are combined into one
Basic Business Statistics, 8e © 2002
Prentice-Hall, Inc.
Chap 1-38
Population divided into several “clusters,” each
representative of the population
Simple random sample selected from each
The samples are combined into one
Population
divided
into 4
clusters.
Simple random sample and systematic sample
Simple to use
May not be a good representation of the population’s
underlying characteristics
Stratified sample
Ensures representation of individuals across the entire
population
Cluster sample
More cost effective
Less efficient (need larger sample to acquire the same
level of precision)
Kế hoạch điều tra là gì ?
- Là một tài liệu dưới dạng văn bản:
+ đề cập những vấn đề hoặc cần được hiểu
+ thống nhất, trình tự và phương pháp tiến hành cuộc
điều tra.
+ những vấn đề thuộc về chuẩn bị và tổ chức tồn bộ
cuộc điều tra.
21/01/2015
11
- Mơ tả mục đích điều tra
- Xác định đối tượng điều tra và đơn vị điều tra
- Nội dung điều tra (mục lục các tiêu thức cần thu
thập dữ liệu trên các đơn vị điều tra)
- Xác định thời điểm thời kì điều tra.
- Biểu điều tra và bảng giải thích cách ghi biểu
41 42
1 MỤC TIÊU
Giúp đáp viên hiểu đúng nội dung câu hỏi.
Động viên, tranh thủ sự cộng tác.
Hướng dẫn cách trả lời.
Tối thiểu các sai sĩt cĩ thể xảy ra khi đáp
viên trả lời.
43
2 NỘI DUNG BẢN CÂU HỎI
Phần giới thiệu
Giới thiệu bản thân phỏng vấn viên.
Giới thiệu lý do, mục đích nghiên cứu.
Khoảng thời gian cần thiết để hồn thành.
44
2 NỘI DUNG BẢN CÂU HỎI
Phần sàng lọc
Chọn đúng đối tượng để thu dữ liệu.
Thường dùng BCH phân đơi.
Phần nội dung chính
Đa số câu hỏi liên quan đến nội dung NC.
Phần quản lý: xác nhận, lời cam đoan, mẫu số.
21/01/2015
12
45
Phần giới thiệu
Xin chào, tơi là thuộc nhĩm nghiên cứu .
Chúng tơi đang thực hiện đề tài. Anh (chị) vui lịng
dành chút thời gian khoảng để giúp chúng tơi trả
lời một số câu hỏi dưới đây.
Chúng tơi rất hoan nghênh sự cộng tác và giúp đỡ
của anh (chị). Các ý kiến trả lời của anh (chị) sẽ
được đảm bảo giữ bí mật tuyệt đối.
46
Nghiên cứu số Vùng, địa phương
Bảng câu hỏi Phỏng vấn viên
Phỏng vấn lúc Thời gian phỏng vấn
Giám sát viên Kết luận của GSV
Kiểm tra viên Kết quả kiểm tra
Tên người trả lời Địa chỉ
Điện thoại
47
1 Xác định thơng tin cần thiết
Dự án nghiên cứu Bảng câu hỏi Nhĩm người trả lời
Danh mục các
thơng tin cần cĩ
Các câu hỏi cần
được chi tiết
Các dữ liệu cần thu
thập
Vd: năng suất lúa Sản lượng từng vụ
Diện tích từng vụ
Sản lượng đã thu
hoạch
Diện tích gieo trồng
48
2 XÁC ĐỊNH HÌNH THỨC PHỎNG VẤN
• Thư tín: tiện lợi, chi phí thấp nhưng tỷ lệ trả
lời thấp, khĩ xác định độ tin cậy của thơng tin
được thu thập.
• Điện thoại: tốn kém, chỉ áp dụng khi thu thập
ít thơng tin và thời gian phỏng vấn ngắn;
thơng tin tương đối tin cậy
• Trực tiếp: thơng tin tin cậy, tỷ lệ trả lời cao
nhưng tốn kém
21/01/2015
13
49
3 LỰA CHỌN CẤU TRÚC CÂU HỎI
Câu hỏi MỞ:
• Phần trả lời khơng định trước, đáp viên tự trả lời theo suy nghĩ
• Khai thác ý kiến mới.
• Tạo quan hệ mật thiết khi trả lời.
• Khĩ tập hợp, mã hĩa, phân tích.
• Khơng phù hợp với phỏng vấn bằng thư tín.
• Khĩ khăn khi đáp viên trả lời dài dịng, lạc đề.
50
3 LỰA CHỌN CẤU TRÚC CÂU HỎI
Câu hỏi ĐĨNG:
Câu trả lời được soạn sẵn, đáp viên chỉ chọn những trả lời sẵn
cĩ.
Ví dụ:
•Ơng (bà) trồng lúa theo mơ hình 3g3t
1. Cĩ (tiếp tục) 2. Khơng (tạm dừng)
•Ơng (bà) gặp những khĩ khăn nào trong canh tác lúa?
Vốn
Lao động
Cơng nghệ
Thời tiết
51
4 TỪ NGỮ SỬ DỤNG TRONG BCH
• Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ:
Who, What, Where, When, Why, How.
• Sử dụng từ ngữ đơn giản, thơng dụng.
• Tránh dùng từ ngữ trừu tượng. (Vd: đi sthị cĩ
thường khơng?)
• Tránh dùng câu hỏi cĩ 2 vế song song (vừa - vừa).
• Cẩn thận câu hỏi liên quan đến tự ái cá nhân. (hỏi
về trình độ,..).
• Ý nghĩa từ ngữ được sử dụng? Cĩ nghĩa nào khác
khơng?
• Từ đồng âm khác nghĩa.
• Từ địa phương (vd: lợn-heo, trà-chè,)
52
5 ĐIỀU CHỈNH BCH
• Tiến hành điều tra thử (pretest, pilot survey)
• Bổ sung, chỉnh sửa nếu cĩ
• Những cuộc phỏng vấn mơ phỏng.
• Câu trả lời khơng đầy đủ, lạc đề, sai nội dung, khơng
đọc được.
• Hiệu chỉnh sai sĩt thơng qua các BCH khác.
• Dùng viết khác màu để chỉnh sửa.
• Thống nhất nguyên tắc chỉnh lý chung.
21/01/2015
14
53
6 NHẬP SỐ LIỆU
• Mã hĩa các câu hỏi và trả lời trước khi nhập.
• Soạn thảo các tập tin mơ tả việc mã hĩa để phục vụ
cho việc đọc số liệu trong tập tin dữ liệu.
• Nhập số liệu vào máy tính, các phần mềm xử lý bảng
tính: Excel, SPSS, Stata, Limdep,
• Kiểm tra độ chính xác của việc nhập: so sánh ngẫu
nhiên một số mẫu; tổ chức nhiều người nhập liệu song
song,
54
7 XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU
• Mã hĩa các câu hỏi và trả lời trước khi nhập.
• Soạn thảo các tập tin mơ tả việc mã hĩa để phục vụ
cho việc đọc số liệu trong tập tin dữ liệu.
• Nhập số liệu vào máy tính, các phần mềm xử lý bảng
tính: Excel, SPSS, Stata, Limdep,
• Kiểm tra độ chính xác của việc nhập: so sánh ngẫu
nhiên một số mẫu; tổ chức nhiều người nhập liệu song
song,
55
i. Phân tích thống kê mơ tả
Độ tập trung: mean, mode, median.
Độ phân tán:phương sai, độ lệch chuẩn,
dãy biến động, hệ số biến động.
ii. Phân tích tần số: đếm tần số xuất hiện,
đồ thị phân phối tần số.
iii. Phân tích phương sai: một chiều, nhiều
chiều
iv. Phân tích hồi quy tương quan,
56
Những câu hỏi
cần trả lời
Các bước cần
thực hiện
Các cơng việc chính trong
mỗi bước
Các số liệu đã được thu thập
cho mỗi mục tiêu NC là gì?
Số liệu cĩ hồn chỉnh và chính
xác khơng?
Chuẩn bị số liệu cho
phân tích
-Xem xét lại việc thu thập tại thực
địa,
-Lập bảng kiểm kê các số liệu cho mỗi
mục tiêu,
-Xếp thứ tự các số liệu và kiểm tra
chất lượng,
-Kiểm tra output của máy tínhCác số liệu trơng như thế nào?
Các số liệu cĩ thể được tĩm tắt
như thế nào cho phân tích đơn
giản?
Tĩm tắt số liệu và mơ
tả các biến/xác định
biến mới
Bảng tần suất, biểu đồ, biểu đồ
phát triển, tỷ trọng, tần suất chéo,
hệ số tương quan, các thống kê
mơ tả,
21/01/2015
15
57
Sự tương quan giữa các
biến số được xác định như
thế nào?
Phân tích sự tương
quan
-Bảng tần suất chéo,
-Đo lường sự tương quan,
-Xử lý các biến nhiễu.
Cĩ đo lường sự chênh lệch
hay tương quan giữa các
biến khơng?
Chuẩn bị cho phân tích
thống kê
- Các đo lường sự phân tán, phân
phối chuẩn và sự biến động mẫu
Xác định loại của phân
tích thống kê
- Lựa chọn các kiểm định về mức
ý nghĩa
Làm thế nào sự khác biệt
giữa các nhĩm cĩ thể được
xác định?
Phân tích các quan sát
theo cặp và lẻ
T-test, chi-square test
paired t-test
Mc-Nemar’s chi-square test
Làm thế nào sự tương quan
giữa các biến cĩ thể được
xác định?
Thực hiện các đo
lường về sự tương
quan
Biểu đồ phân tán,
Đường hồi quy, và
Hệ số tương quan
58
Báo cáo nên được viết như
thế nào?
Viết báo cáo và xây dựng
các kiến nghị
-Chuẩn bị dàn ý của báo cáo,
-Trình bày và diễn dịch số liệu,
-Bản nháp và bản nháp lần 2.
-Thảo luận và tĩm tắt kết luận
-Xây dựng kiến nghị
Những kết quả và kiến
nghị nên được cơng bố và
sử dụng như thế nào?
Trình bày tĩm tắt và
bản nháp cho việc
thực hiện các kiến
nghị
Thảo luận những tĩm tắt và kế
hoạch thực hiện đối với những
người liên quan
Sai số do đăng kí:
sai số này phát sinh do việc ghi chép tài liệu khơng
chính xác , do khai báo sai,..
Sai số do tính chất đại biểu:
sai số này chỉ xảy ra trong điều tra khơng tồn bộ,
đặc biệt là điều tra chọn mẫu.
59
+ Làm tốt cơng tác chuẩn bị điều tra
+ Theo dõi, kiểm tra quá trình điều tra.
+ Làm tốt cơng tác tuyên truyền vận động
60
21/01/2015
16
Coverage error
Non response error
Sampling error
Measurement error
Excluded from
frame.
Follow up on non
responses.
Chance differences from
sample to sample.
Bad Question!
Các file đính kèm theo tài liệu này:
- thong_ke_kinh_techuong2_8992.pdf