Nhằm hướng dẫn sinh viên cách:
Cách nhập liệu, xử lý và phân tích dữ liệu.
Các kỹ thuật phân tích dữ liệu mang tính khám phá (exploratory data analysis).
Giới thiệu phần mềm SPSS; cách sử dụng thống kê phân tích trắc nghiệm.
39 trang |
Chia sẻ: Thục Anh | Ngày: 19/05/2022 | Lượt xem: 341 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Phương pháp nghiên cứu khoa học - Bài 5: Xử lý thông tin – nhập và xử lý dữ liệu - Hoàng Thanh Liêm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
B ài 5 .
XỬ LÝ THÔNG TIN – NHẬP VÀ XỬ LÝ DỮ LIỆU
TS. Hoàng Thanh Liêm
2
Tài liệu tham khảo và học tập
1
Trần Tiến Khai (2012) phương pháp nghiên cứu kinh tế, kiến thức cơ bản, NXB Lao động.
Giáo trình: Vũ Cao Đàm (2018) phương pháp luận nghiên cứu khoa học (tài liệu học tập chính)
Bài giảng Trần Tiến Khai (2013), Khoa KTPT- ĐH Mở TP.HCM (tài liệu tham khảo).
2
3
5 .1
Giới
thiệu
Nhằm hướng dẫn sinh viên cách:
Cách nhập liệu, xử lý và phân tích dữ liệu.
Các kỹ thuật phân tích dữ liệu mang tính khám phá (exploratory data analysis).
G iới thiệu phần mềm SPSS; c ách sử dụng thống kê phân tích trắc nghiệm .
2
5 .2
Quy
trình
phân
tích
dữ
liệu
Hình 5 .1 Các bước khám
phá, trắc nghiệm và phân
Thu thập và chuẩn
bị dữ liệu
tích
cứu
trong
quá
trình
nghiên
3
Ra quyết định
Báo cáo nghiên cứu
Trắc nghiệm giả thiết
Phân tích và diễn giải dữ liệu
Phân tích mô tả các biến số
Lập bảng chéo cho các biến số
Trình bày dữ liệu (histogram, boxplots, Pareto, stem-and- leaf, AID, etc.)
Phân tích dữ liệu
Kế hoạch phân tích sơ khởi
Xác định lại giả tthuyết
Thể hiện trực quan dữ liệu
Lập đề cương NC
5 .3
Nhập
số
liệu
5 .3.1 Cách
tính
Mục tiêu:
bố
trí dữ
liệu trên máy
Nhằm tạo
nhập liệu
Nhằm tạo dữ liệu
điều kiện
thuận tiện cho việc
sự thuận
lợi cho việc chỉnh sửa
4
5 .3
Nhập
số
liệu
Thực hiện:
Nguyên tắc chung: đặt tên biến ngắn gọn, viết
tắt (tiếng Việt không dấu hoặc tiếng Anh). Tên biến nên được đặt theo quy định.
Dùng Excel: dễ thao tác và chỉnh sửa, không gian lưu trữ hạn chế, công cụ thống kê và kinh tế lượng không đủ cho phân tích.
Dùng S P SS: không gian lưu trữ gần như không hạn chế, công cụ thống kê và kinh tế lượng phát tr i ển đầy đủ cho nhu c ầ u phân tích. Khai báo dữ liệu bắt b u ộc, mất thời gian.
5
GIỚI THIỆU PHẦN MỀM SPSS 20.0
SPSS là gì? SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. Phần mềm SPSS hỗ trợ xử lý và phân tích dữ liệu sơ cấp - là các thông tin được thu thập trực tiếp từ đối tượng nghiên cứu, thường được sử dụng rộng rãi trong các các nghiên cứu điều tra xã hội học và kinh tế lượng.
2. Chức năng của SPSS: Phần mềm SPSS có các chức năng chính bao gồm:
+ Phân tích thống kê gồm Thống kê mô tả: Lập bảng chéo, Tần suất, Mô tả, Khám phá, Thống kê Tỷ lệ Mô tả Thống kê đơn biến: Phương tiện, t-test, ANOVA, tương quan (hai biến, một phần, khoảng cách), kiểm tra không giới Dự đoán cho kết quả số: Hồi quy tuyến tính Dự đoán để xác định các nhóm: Phân tích các yếu tố, phân tích cụm (hai bước, K- phương tiện, phân cấp), phân biệt.
+ Quản lý dữ liệu bao gồm lựa chọn trường hợp, chỉnh sửa lại tập tin, tạo ra dữ liệu gốc
+ Vẽ đồ thị: Được sử dụng để vẽ nhiều loại đồ thị khác nhau với chất lượng cao
KHỞI ĐỘNG SPSS
- SPSS có nhiều phiên bản 20, 21, 22, 23 bạn phải download về máy tính của mình.
- T rên màn hình desktop của Windows nhấp vào biểu tượng SPSS. Hoặc bạn mở phím Start >>> All program>>> SPSS for Windows >>>SPSS ( phiên bản hiện tại bạn đang cài) Sau đó tùy vào mục đích của bạn, bạn cần thống kê suy diễn, vẽ biểu đồ hay các phân tích hồi quy tuyến tính,...để lựa chọn phù hợp.
QUY TRÌNH LÀM VIỆC CỦA SPSS
B1 : Mở các files dữ liệu – theo định dạng file của SPSS hoặc bất kỳ định dạng nào;
B2: Sử dữ liệu – như tính tổng và trung bình các cột hoặc các hàng dữ liệu;
B3: Tạo các bảng và các biểu đồ - bao gồm đếm các phổ biến hay các thống kê tổng hơn (nhóm) thông qua các trường hợp;
B4: Chạy các thống kê suy diễn như ANOVA, hồi quy và phân tích hệ số;
B5: Lưu dữ liệu và đầu ra theo nhiều định dạng file.
B6 : C húng ta sẽ thực hành sẽ hiểu kỹ hơn về những bước sử dụng SPSS (có hướng dẫn thực hành riêng)
VD : G iới thiệu đề tài nghiên cứu:
C ác yếu tố ảnh hưởng đến lựa chọn điểm đến du lịch Bình Thuận của Du khách trong nước
(sử dụng phần mềm SPSS 20.0 phân tích)
Các bước tiến hành nghiên cứu
Phương pháp nghiên cứu định tính
Đề tài kết hợp phương pháp nghiên cứu định tính và nghiên cứu định lượng
1. Nghiên cứu định tính:
+ Nghiên cứu định tính được thực hiện bằng cách tìm hiểu mô hình nghiên cứu trong nước và ngoài nước. Tổng hợp lý thuyết từ các nghiên cứu trước nhằm xây dựng mô hình nghiên cứu lý thuyết ( 03 công trình nghiên cứu trong nước và 03 công trình nghiên cứu nước ngoài).
+ Thông qua thảo luận nhóm và hỏi ý kiến chuyên gia nhằm phát hiện, điều chỉnh và bổ sung các biến quan sát dùng để thực hiện đo lường các khái niệm nghiên cứu về các yếu tố ảnh hưởng đến việc lựa chọn điểm đến du lịch (thảo luận nhóm với các chuyên gia).
+ Kết quả của nghiên cứu này là thang đo, mô hình nghiên cứu đã được hiệu chỉnh và bảng câu hỏi chuẩn bị cho nghiên cứu chính thức
Phương pháp nghiên cứu định lượng
13
Công cụ
Phần mềm SPSS 20.0
Định lượng
Khảo sát và phân tích xử lý số liệu
ĐỊNH TÍNH
C ơ sở lý thuyết
Thảo luận nhóm nghiên cứu
Thang đo
14
Mô hình “ Các yếu tố ảnh hưởng việc lựa chọn điểm đến du lịch Bình Thuận của du khách trong nước”
S ự lựa chọn điểm đến du lịch Bình Thuận của du khách
H1
H2
H3
H4
H5
H6
Giá cả dịch vụ hợp lý
Nguồn nhân lực
S ự đa dạng v ề SPDV
Điểm đến an toàn
Môi trường tự nhiên
Cơ sở hạ tầng du l
Giả thuyết nghiên cứu
- Theo như tên gọi của đề tài, đây chỉ là các giả thuyết, giả thuyết này chúng ta sẽ khẳng định nó là đúng hay sai sau bước phân tích hồi quy tuyến tính. Thường chúng ta sẽ dựa trên những gì bản thân nhận thấy để kỳ vọng rằng mối quan hệ giữa biến độc lập và biến phụ thuộc là thuận chiều hay nghịch chiều. Hoặc cho dù bạn không biết bất kỳ điều gì về mối quan hệ này, bạn vẫn cứ đặt giả thuyết kỳ vọng của mình.
xem xét trên thực tế và kỳ vọng các biến độc lập đều tác động thuận chiều với biến phụ thuộc nên sẽ ký hiệu dấu
- Trường hợp có biến độc lập tác động thuận chiều với biến phụ thuộc, chúng ta sẽ ký hiệu dấu (+). Ngược lại là dấu (–).
- Nếu sau bước hồi quy tuyến tính, kết quả xuất ra giống với kỳ vọng thì chúng ta chấp nhận giả thuyết, ngược lại, ta bác bỏ giả thuyết. Chúng ta đừng bị sai lầm khi nhận định bác bỏ là tiêu cực, là xấu; còn chấp nhận là tích cực, là tốt. Ở đây không có sự phân biệt tốt xấu, tích cực hay tiêu cực gì cả mà chỉ là xem xét cái mình nghĩ nó có giống với thực tế số liệu nghiên cứu hay không mà thôi .
16
GIẢ THUYẾT NGHIÊN CỨU
+ H1: Nguồn nhân lực tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận của KDL.
+ H2: Giá cả dịch vụ hợp lý có tác động cùng chiều (+) với sự lưa chọn điểm đến của du lịch Bình Thuận.
+ H3: Đa dạng về các sản phẩm dịch vụ có tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận của KDL .
+ H4: Điểm đến an toàn có tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận.
+ H5: Môi trường tự nhiên có tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận của KDL.
+ H6: Cơ sở hạ tầng du lịch có tác động cùng chiều với sự lựa chọn điểm đến du lịch Bình Thuận của KDL.
17
GIẢ THUYẾT VỀ SỰ KHÁC BIỆT KHÁC
+ Nhóm giả thuyết về sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo các biến đặc điểm cá nhân của KDL như: độ tuổi, nghề nghiệp, giới tính.
+ H7: Có sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo giới tính.
+ H8: Có sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo độ tuổi.
+ H9: Có sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo trình độ.
18
THIẾT KẾ BẢNG CÂU HỎI KHẢO SÁT
Nhóm nghiên cứu chọn thang đo Likert 5 mức độ: từ 1 điểm - thể hiện mức độ hoàn toàn không đồng ý cho đến 5 điểm - thể hiện mức độ hoàn toàn đồng ý.
Cụ thể như sau:
Mức 1: Hoàn toàn không đồng ý
Mức 2: Không đồng ý
Mức 3: Bình thường
Mức 4 : Đồng ý
Mức 5: Hoàn toàn đồng ý
Mỗi câu hỏi sẽ là một phát biểu về một tiêu chí được xem là cơ sở cho việc đánh giá lựa chọn điểm đến du lịch Bình Thuận của du khách. Với cách thiết kế như vậy, KDL khi được khảo sát sẽ cho biết đánh giá của bản thân về những yếu tố ảnh hưởng đến việc lựa chọn điểm đến du lịch Bình Thuận.
Bảng câu hỏi chính thức sau khi thảo luận nhóm gồm có 30 câu hỏi tương ứng với 6 yếu tố được cho là có ảnh hưởng đến việc lựa chọn điểm đến du lịch Bình Thuận của du khách.
19
MÃ HÓA THANG ĐO TRONG MÔ HÌNH
1. Thang đo về nguồn nhân lực du lịch được ký hiệu là NNL gồm 5 biến quan sát ký hiệu NNL1 đến NNL5 và được đo bằng thang đo Likert 5 mức độ.
2. Thang đo về giá cả dịch vụ hợp lý được ký hiệu là GCHL gồm 5 biến quan sát ký hiệu GCHL1 đến GCHL5và được đo b ằng thang đo Likert 5 mức độ
3. Thang đo về sự đa dạng sản phẩm, dịch vụ được ký hiệu là SPDV gồm 5 biến quan sát ký hiệu SPDV1 đến SPDV5 và được đo bằng thang đo Likert 5 mức độ.
4. Thang đo về điểm đến an toàn được ký hiệu là DDAT gồm 5 biến quan sát ký hiệu DDAT1 đến DDAT5 và được đo bằng thang đo Likert 5 mức độ.
5. Thang đo Môi trường tự nhiên được ký hiệu là MTTN gồm 5 biến quan sát ký hiệu MTTN1 đến MTTN5 và được đo bằng thang đo Likert 5 mức độ.
6. Thang đo Cơ sở hạ tầng du lịch được ký hiệu là CSHT gồm 5 biến quan sát ký hiệu CSHT1 đến CSHT5 và được đo bằng thang đo Likert 5 mức độ.
20
CHỌN MẪU NGHIÊN CỨU ĐỊNH LƯỢNG
Có nhiều công thức lấy mẫu, tuy nhiên, các công thức lấy mẫu phức tạp tác giả sẽ không đề cập trong tài liệu này bởi vì nó thiên về toán thống kê. Nếu lấy mẫu theo các công thức đó, lượng mẫu nghiên cứu cũng là khá lớn, hầu như chúng ta không đủ thời gian và nguồn lực để thực hiện. Do vậy, đa phần chúng ta lấy mẫu trên cơ sở tiêu chuẩn 5:1 của Bollen (1989)1, tức là để đảm bảo phân tích dữ liệu (phân tích nhân tố khám phá EFA) tốt thì cần ít nhất 5 quan sát cho 1 biến đo lường và số quan sát không nên dưới 100.
Mô hình có 6 nhân tố và 30 biến quan sát (các câu hỏi sử dụng thang đo Likert), do vậy mẫu tối thiểu sẽ là 30 x 5 = 150 .
* Lưu ý, mẫu này là mẫu tối thiểu chứ không bắt buộc chúng ta lúc nào cũng lấy mẫu này, mẫu càng lớn thì nghiên cứu càng có giá trị. Cụ thể trong nghiên cứu này, tác giả lấy mẫu là 325 .
21
VD: Thực hiện nghiên cứu định lượng mô hình nghiên cứu
Các yếu tố ảnh hưởng đến lựa chọn điểm đến du lịch BT
Mô tả
Số lượng (bảng)
Tỷ lệ (%)
Số bảng câu hỏi phát ra
325
100
Số bảng câu hỏi thu về
325
100
Trong đó
Số bảng câu hỏi hợp lệ
301
92,62
Số bảng câu hỏi không hợp lệ
24
7,38
22
Kiểm định độ tin cậy Cronbach’s Alpha
1 . Lý thuyết về giá trị và độ tin cậy của đo lường
Một đo lường được coi là có giá trị (validity) nếu nó đo lường đúng được cái cần đo lường (theo Campbell & Fiske 1959). Hay nói cách khác, đo lường đó sẽ không có hiện tượng sai số hệ thống và sai số ngẫu nhiên.
• Sai số hệ thống: sử dụng thang đo không cân bằng, kỹ thuật phỏng vấn kém
• Sai số ngẫu nhiên: phỏng vấn viên ghi nhầm số đó của người trả lời, người trả lời thay đổi tính cách nhất thời như do mệt mỏi, đau yếu, nóng giận làm ảnh hưởng đến câu trả lời của họ. Trên thực tế nghiên cứu, chúng ta sẽ bỏ qua sai số hệ thống và quan tâm đến sai số ngẫu nhiên. Khi một đo lường vắng mặt các sai số ngẫu nhiên thì đo lường có độ tin cậy (reliability). Vì vậy, một đo lường có giá trị cao thì phải có độ tin cậy cao.
23
Kiểm định độ tin cậy Cronbach’s Alpha
2 . Đo lường độ tin cậy bằng hệ số Cronbach’s Alpha
- Cronbach (1951) đưa ra hệ số tin cậy cho thang đo. Chú ý, hệ số Cronbach’s Alpha chỉ đo lường độ tin cậy của thang đo (bao gồm từ 3 biến quan sát trở lên) chứ không tính được độ tin cậy cho từng biến quan sát.( Cronbach’s Alpha chỉ thực hiện khi nhân tố có 3 biến quan sát trở lên trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 355.)
- Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn [0,1]. Về lý thuyết, hệ số này càng cao càng tốt (thang đo càng có độ tin cậy cao). Tuy nhiên điều này không hoàn toàn chính xác. Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) cho thấy có nhiều biến trong thang đo không có khác biệt gì nhau, hiện tượng này gọi là trùng lắp trong thang đo.( Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) gây ra hiện tượng trùng lắp trong thang đo trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 364.)
24
Tính hệ số tin cậy Cronbach’s Alpha bằng SPSS
3 . Các tiêu chuẩn kiểm định
- Nếu một biến đo lường có hệ số tương quan biến tổng Corrected Item – Total Correlation ≥ 0.3 thì biến đó đạt yêu cầu. ( Tương quan biến tổng ≥ 0.3 trích nguồn từ: Nunnally, J. (1978), Psychometric Theory, New York, McGraw- Hill.)
- Mức giá trị hệ số Cronbach’s Alpha: • Từ 0.8 đến gần bằng 1: thang đo lường rất tốt. • Từ 0.7 đến gần bằng 0.8: thang đo lường sử dụng tốt. • Từ 0.6 trở lên: thang đo lường đủ điều kiện.
- Chúng ta cũng cần chú ý đến giá trị của cột Cronbach's Alpha if Item Deleted, cột này biểu diễn hệ số Cronbach's Alpha nếu loại biến đang xem xét. Thông thường chúng ta sẽ đánh giá cùng với hệ số tương quan biến tổng Corrected Item – Total Correlation, nếu giá trị Cronbach's Alpha if Item Deleted lớn hơn hệ số Cronbach Alpha và Corrected Item – Total Correlation nhỏ hơn 0.3 thì sẽ loại biến quan sát đang xem xét để tăng độ tin cậy của thang đo.
25
Kết quả nghiên cứu định lượng
Hệ số Cronbach alpha
Cronbach's Alpha yếu tố nguồn nhân lực = 0.880
1
Cronbach's Alpha yếu tố giá cả = 0.764
2
3
Cronbach's Alpha yếu tố đa dạng SPDV = 0.839
4
Cronbach's Alpha yếu tố điểm đến an toàn = 0.812
5
Cronbach's Alpha yếu tố môi trường = 0.843
6
Cronbach's Alpha yếu tố hạ tầng = 0.836
26
Phân tích nhân tố khám phá EFA
- Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn .
- Hai giá trị quan trọng được xem xét trong EFA là giá trị hội tụ và giá trị phân biệt . (Hai giá trị quan trọng trong phân tích nhân tố khám phá EFA bao gồm: giá trị hội tụ và giá trị phân biệt. Trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 378.) Hiểu một cách đơn giản:
1. Thỏa mãn "Giá trị hội tụ": Các biến quan sát hội tụ về cùng một nhân tố.
2. Đảm bảo "Giá trị phân biệt": Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác.
Các tiêu chí trong phân tích EFA
- Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
• Factor Loading ở mức 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
• Factor Loading ở mức 0.5: Biến quan sát có ý nghĩa thống kê tốt.
• Factor Loading ở mức 0.7: Biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau.
Các tiêu chí trong phân tích EFA
- Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
• Factor Loading ở mức 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
• Factor Loading ở mức 0.5: Biến quan sát có ý nghĩa thống kê tốt.
• Factor Loading ở mức 0.7: Biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau.
Các tiêu chí trong phân tích EFA
- Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
• Factor Loading ở mức 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
• Factor Loading ở mức 0.5: Biến quan sát có ý nghĩa thống kê tốt.
• Factor Loading ở mức 0.7: Biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau.
Phân tích tương quan
- Sau khi đã có được các biến đại diện độc lập và phụ thuộc ở phần phân tích nhân tố EFA, chúng ta sẽ tiến hành phân tích tương quan Pearson để kiểm tra mối quan hệ tuyến tính giữa các biến này ( ký hiệu là r) được thực hiện để xem xét mối quan hệ giữa các biến độc lập với biến trong mô hình nghiên cứu (Phân tích tương quan được thực hiện trước khi phân tích hồi quy bội), và để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng. r nằm trong khoảng -1 ≤ r ≤ 1 (Trọng và Ngọc, 2008, tr.197, tập 1).
Một số lưu ý phân tích Pearson:
Tương quan Pearson r có giá trị dao động từ -1 đến 1:
• Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm.
• Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.
• Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng.
• Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến.
. Trên Bảng trên đây minh họa cho kết quả tương quan Pearson của nhiều biến đưa vào cùng lúc trong SPSS. Trong bảng kết quả tương quan Pearson ở trên: Hàng Pearson Correlation là giá trị r để xem xét sự tương thuận hay nghịch, mạnh hay yếu giữa 2 biến. Hàng Sig. (2-tailed) là sig kiểm định xem mối tương quan giữa 2 biến là có ý nghĩa hay không. Sig < 0.05, tương quan có ý nghĩa; sig ≥ 0.05, tương quan không có ý nghĩa. Cần xem xét sig trước, nếu sig < 0.05 mới nhận xét tới giá trị tương quan Pearson r. Hàng N hiển thị cỡ mẫu của tập dữ liệu.
Phân tích hồi quy đa biến
- Khác với tương quan Pearson, trong hồi quy các biến không có tính chất đối xứng như phân tích tương quan. Vai trò giữa biến độc lập và biến phụ thuộc là khác nhau. X và Y hay Y và X có tương quan với nhau đều mang cùng một ý nghĩa, trong khi đó với hồi quy, ta chỉ có thể nhận xét: X tác động lên Y hoặc Y chịu tác động bởi X.
- Đối với phân tích hồi quy tuyến tính bội, chúng ta giả định các biến độc lập X1, X2, X3 sẽ tác động đến biến phụ thuộc Y. Ngoài X1, X2, X3 còn có rất nhiều những nhân tố khác ngoài mô hình hồi quy tác động đến Y mà chúng ta không liệt kê được.
Các tiêu chí trong phân tích hồi quy
- Giá trị R2 (R Square), R2 hiệu chỉnh (Adjusted R Square) phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy. R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức dao động của 2 giá trị này là từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là gần như không tưởng dù mô hình đó tốt đến như:
Giá trị sig của kiểm định F được sử dụng để kiểm định độ phù hợp của mô hình hồi quy. Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử đụng được. Giá trị này thường nằm trong bảng ANOVA.
Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau).
Các tiêu chí trong phân tích hồi quy
- Hệ số k’ là số biến độc lập đưa vào chạy hồi quy, N là kích thước mẫu.
- Giá trị sig của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu sig kiểm định t của hệ số hồi quy của một biến độc lập nhỏ hơn 0.05, ta kết luận biến độc lập đó có tác động đến biến phụ thuộc. Mỗi biến độc lập tương ứng với một hệ số hồi quy riêng, do vậy mà ta cũng có từng kiểm định t riêng. Giá trị này thường nằm trong bảng Coefficients .
Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến.
- Kiểm tra các giả định hồi quy, bao gồm phần dư chuẩn hóa và liên hệ tuyến tính ( căn cứ vào biểu đồ Histogram và Normal P-P Plot).
Phương trình hồi quy: Y= ao + a1*X1 + a2*X2 +a3*X3 +a4*X4 +a5*X5 +a6*X6.
Trong đó :
Y : Sự lựa chọn điểm đến du lịch Bình Thuận của du khách
X1 : Nguồn nhân lực
X2 : Giá cả dịch vụ hợp lý
X3 : Sự đa dạng về các sản phẩm dịch vụ
X4 : Điểm đến an toàn
X5 : Môi trường tự nhiên
X6 : Cơ sở hạ tầng
35
Phân tích hồi quy đa biến
Đánh giá mức độ phù hợp của mô hình hồi quy tuyến tính đa biến
36
Mô hình
Hệ số
R
Hệ số
R 2
Hệ số R2 - hiệu chỉnh
Sai số chuẩn của ước lượng
Thống kê thay đổi
Hệ số
Hệ số R 2 sau khi đổi
Hệ số F khi đổi
Bậc tự do 1
Bậc tự do 2
DurbinWatson
1
.836 a
.699
.693
.27532
.699
113.901
6
294
2.085
a Biến độc lập: (Constant) NL, GC, SP, AT, MT, CSHT
b Biến phụ thuộc: Y FinV (0.05,6.301) =2.1288
Kiểm định mô hình hồi quy tuyến tính đa biến
Mô hình
Hệ số chưa chuẩn hóa
Hệ số chuẩn hóa
t
Sig.
Thống kê đa cộng tuyến
B
Sai số chuẩn
Beta
Hệ số Tolerance
Hệ số VIF
(Constant)
-.369
.145
-2.550
.011
NL
.172
.015
.373
11.511
.000
.975
1.026
GC
.260
.032
.310
8.020
.000
.685
1.459
SP
.211
.035
.254
6.066
.000
.584
1.712
AT
.182
.024
.245
7.614
.000
.985
1.015
MT
.100
.032
.126
3.096
.002
.622
1.608
CSHT
.193
.028
.254
6.873
.000
.748
1.337
Biến phụ thuộc: sự lựa chọn (Y)
37
Sự lựa chọn du khách =
+ 0.373 * Nguồn nhân lực
+ 0.310 *Giá cả dịch vụ hợp lý
+ 0.254 * Đa dạng SP-DV
+ 0.254 * Cơ sở hạ tầng
+ 0.245 * Điểm đến an toàn
+ 0.126 * Môi trường tự nhiên
38
Mức độ quan trọng và Kiểm đị nh của từng yếu tố
39
Một số hàm ý quản trị
Yếu tố giá cả dịch vụ hợp lý
Yếu tố nguồn nhân lực
Yếu tố đa dạng SPDV
Yếu tố môi trường tư nhiên
Yếu tố hạ tầng
Yếu tố điểm đến an toàn
Sự lựa chọn điểm đến của du khách
Các file đính kèm theo tài liệu này:
- bai_giang_phuong_phap_nghien_cuu_khoa_hoc_bai_5_xu_ly_thong.pptx