Bài giảng Phương pháp nghiên cứu khoa học - Bài 5: Xử lý thông tin – nhập và xử lý dữ liệu - Hoàng Thanh Liêm

Nhằm hướng dẫn sinh viên cách:

 Cách nhập liệu, xử lý và phân tích dữ liệu.

 Các kỹ thuật phân tích dữ liệu mang tính khám phá (exploratory data analysis).

Giới thiệu phần mềm SPSS; cách sử dụng thống kê phân tích trắc nghiệm.

39 trang | Chia sẻ: Thục Anh | Lượt xem: 411 | Lượt tải: 0

Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Phương pháp nghiên cứu khoa học - Bài 5: Xử lý thông tin – nhập và xử lý dữ liệu - Hoàng Thanh Liêm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

B ài 5 . XỬ LÝ THÔNG TIN – NHẬP VÀ XỬ LÝ DỮ LIỆU TS. Hoàng Thanh Liêm 2 Tài liệu tham khảo và học tập 1 Trần Tiến Khai (2012) phương pháp nghiên cứu kinh tế, kiến thức cơ bản, NXB Lao động. Giáo trình: Vũ Cao Đàm (2018) phương pháp luận nghiên cứu khoa học (tài liệu học tập chính) Bài giảng Trần Tiến Khai (2013), Khoa KTPT- ĐH Mở TP.HCM (tài liệu tham khảo). 2 3 5 .1 Giới thiệu Nhằm hướng dẫn sinh viên cách:  Cách nhập liệu, xử lý và phân tích dữ liệu.  Các kỹ thuật phân tích dữ liệu mang tính khám phá (exploratory data analysis).  G iới thiệu phần mềm SPSS; c ách sử dụng thống kê phân tích trắc nghiệm . 2 5 .2 Quy trình phân tích dữ liệu Hình 5 .1 Các bước khám phá, trắc nghiệm và phân Thu thập và chuẩn bị dữ liệu tích cứu trong quá trình nghiên 3 Ra quyết định Báo cáo nghiên cứu Trắc nghiệm giả thiết Phân tích và diễn giải dữ liệu Phân tích mô tả các biến số Lập bảng chéo cho các biến số Trình bày dữ liệu (histogram, boxplots, Pareto, stem-and- leaf, AID, etc.) Phân tích dữ liệu Kế hoạch phân tích sơ khởi Xác định lại giả tthuyết Thể hiện trực quan dữ liệu Lập đề cương NC 5 .3 Nhập số liệu 5 .3.1 Cách tính  Mục tiêu: bố trí dữ liệu trên máy  Nhằm tạo nhập liệu  Nhằm tạo dữ liệu điều kiện thuận tiện cho việc sự thuận lợi cho việc chỉnh sửa 4 5 .3 Nhập số liệu  Thực hiện: Nguyên tắc chung: đặt tên biến ngắn gọn, viết tắt (tiếng Việt không dấu hoặc tiếng Anh). Tên biến nên được đặt theo quy định. Dùng Excel: dễ thao tác và chỉnh sửa, không gian lưu trữ hạn chế, công cụ thống kê và kinh tế lượng không đủ cho phân tích. Dùng S P SS: không gian lưu trữ gần như không hạn chế, công cụ thống kê và kinh tế lượng phát tr i ển đầy đủ cho nhu c ầ u phân tích. Khai báo dữ liệu bắt b u ộc, mất thời gian.    5 GIỚI THIỆU PHẦN MỀM SPSS 20.0 SPSS là gì? SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. Phần mềm SPSS hỗ trợ xử lý và phân tích dữ liệu sơ cấp - là các thông tin được thu thập trực tiếp từ đối tượng nghiên cứu, thường được sử dụng rộng rãi trong các các nghiên cứu điều tra xã hội học và kinh tế lượng. 2. Chức năng của SPSS: Phần mềm SPSS có các chức năng chính bao gồm: + Phân tích thống kê gồm Thống kê mô tả: Lập bảng chéo, Tần suất, Mô tả, Khám phá, Thống kê Tỷ lệ Mô tả Thống kê đơn biến: Phương tiện, t-test, ANOVA, tương quan (hai biến, một phần, khoảng cách), kiểm tra không giới Dự đoán cho kết quả số: Hồi quy tuyến tính Dự đoán để xác định các nhóm: Phân tích các yếu tố, phân tích cụm (hai bước, K- phương tiện, phân cấp), phân biệt. + Quản lý dữ liệu bao gồm lựa chọn trường hợp, chỉnh sửa lại tập tin, tạo ra dữ liệu gốc + Vẽ đồ thị: Được sử dụng để vẽ nhiều loại đồ thị khác nhau với chất lượng cao KHỞI ĐỘNG SPSS - SPSS có nhiều phiên bản 20, 21, 22, 23 bạn phải download về máy tính của mình. - T rên màn hình desktop của Windows nhấp vào biểu tượng SPSS. Hoặc bạn mở phím Start >>> All program>>> SPSS for Windows >>>SPSS ( phiên bản hiện tại bạn đang cài) Sau đó tùy vào mục đích của bạn, bạn cần thống kê suy diễn, vẽ biểu đồ hay các phân tích hồi quy tuyến tính,...để lựa chọn phù hợp. QUY TRÌNH LÀM VIỆC CỦA SPSS B1 : Mở các files dữ liệu – theo định dạng file của SPSS hoặc bất kỳ định dạng nào; B2: Sử dữ liệu – như tính tổng và trung bình các cột hoặc các hàng dữ liệu; B3: Tạo các bảng và các biểu đồ - bao gồm đếm các phổ biến hay các thống kê tổng hơn (nhóm) thông qua các trường hợp; B4: Chạy các thống kê suy diễn như ANOVA, hồi quy và phân tích hệ số; B5: Lưu dữ liệu và đầu ra theo nhiều định dạng file. B6 : C húng ta sẽ thực hành sẽ hiểu kỹ hơn về những bước sử dụng SPSS (có hướng dẫn thực hành riêng) VD : G iới thiệu đề tài nghiên cứu: C ác yếu tố ảnh hưởng đến lựa chọn điểm đến du lịch Bình Thuận của Du khách trong nước (sử dụng phần mềm SPSS 20.0 phân tích) Các bước tiến hành nghiên cứu Phương pháp nghiên cứu định tính Đề tài kết hợp phương pháp nghiên cứu định tính và nghiên cứu định lượng 1. Nghiên cứu định tính: + Nghiên cứu định tính được thực hiện bằng cách tìm hiểu mô hình nghiên cứu trong nước và ngoài nước. Tổng hợp lý thuyết từ các nghiên cứu trước nhằm xây dựng mô hình nghiên cứu lý thuyết ( 03 công trình nghiên cứu trong nước và 03 công trình nghiên cứu nước ngoài). + Thông qua thảo luận nhóm và hỏi ý kiến chuyên gia nhằm phát hiện, điều chỉnh và bổ sung các biến quan sát dùng để thực hiện đo lường các khái niệm nghiên cứu về các yếu tố ảnh hưởng đến việc lựa chọn điểm đến du lịch (thảo luận nhóm với các chuyên gia). + Kết quả của nghiên cứu này là thang đo, mô hình nghiên cứu đã được hiệu chỉnh và bảng câu hỏi chuẩn bị cho nghiên cứu chính thức Phương pháp nghiên cứu định lượng 13 Công cụ Phần mềm SPSS 20.0 Định lượng Khảo sát và phân tích xử lý số liệu ĐỊNH TÍNH C ơ sở lý thuyết Thảo luận nhóm nghiên cứu Thang đo 14 Mô hình “ Các yếu tố ảnh hưởng việc lựa chọn điểm đến du lịch Bình Thuận của du khách trong nước” S ự lựa chọn điểm đến du lịch Bình Thuận của du khách H1 H2 H3 H4 H5 H6 Giá cả dịch vụ hợp lý Nguồn nhân lực S ự đa dạng v ề SPDV Điểm đến an toàn Môi trường tự nhiên Cơ sở hạ tầng du l Giả thuyết nghiên cứu - Theo như tên gọi của đề tài, đây chỉ là các giả thuyết, giả thuyết này chúng ta sẽ khẳng định nó là đúng hay sai sau bước phân tích hồi quy tuyến tính. Thường chúng ta sẽ dựa trên những gì bản thân nhận thấy để kỳ vọng rằng mối quan hệ giữa biến độc lập và biến phụ thuộc là thuận chiều hay nghịch chiều. Hoặc cho dù bạn không biết bất kỳ điều gì về mối quan hệ này, bạn vẫn cứ đặt giả thuyết kỳ vọng của mình. xem xét trên thực tế và kỳ vọng các biến độc lập đều tác động thuận chiều với biến phụ thuộc nên sẽ ký hiệu dấu - Trường hợp có biến độc lập tác động thuận chiều với biến phụ thuộc, chúng ta sẽ ký hiệu dấu (+). Ngược lại là dấu (–). - Nếu sau bước hồi quy tuyến tính, kết quả xuất ra giống với kỳ vọng thì chúng ta chấp nhận giả thuyết, ngược lại, ta bác bỏ giả thuyết. Chúng ta đừng bị sai lầm khi nhận định bác bỏ là tiêu cực, là xấu; còn chấp nhận là tích cực, là tốt. Ở đây không có sự phân biệt tốt xấu, tích cực hay tiêu cực gì cả mà chỉ là xem xét cái mình nghĩ nó có giống với thực tế số liệu nghiên cứu hay không mà thôi . 16 GIẢ THUYẾT NGHIÊN CỨU + H1: Nguồn nhân lực tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận của KDL. + H2: Giá cả dịch vụ hợp lý có tác động cùng chiều (+) với sự lưa chọn điểm đến của du lịch Bình Thuận. + H3: Đa dạng về các sản phẩm dịch vụ có tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận của KDL . + H4: Điểm đến an toàn có tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận. + H5: Môi trường tự nhiên có tác động cùng chiều (+) với sự lựa chọn điểm đến du lịch Bình Thuận của KDL. + H6: Cơ sở hạ tầng du lịch có tác động cùng chiều với sự lựa chọn điểm đến du lịch Bình Thuận của KDL. 17 GIẢ THUYẾT VỀ SỰ KHÁC BIỆT KHÁC + Nhóm giả thuyết về sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo các biến đặc điểm cá nhân của KDL như: độ tuổi, nghề nghiệp, giới tính. + H7: Có sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo giới tính. + H8: Có sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo độ tuổi. + H9: Có sự khác biệt về sự lựa chọn điểm đến du lịch Bình Thuận của du khách theo trình độ. 18 THIẾT KẾ BẢNG CÂU HỎI KHẢO SÁT Nhóm nghiên cứu chọn thang đo Likert 5 mức độ: từ 1 điểm - thể hiện mức độ hoàn toàn không đồng ý cho đến 5 điểm - thể hiện mức độ hoàn toàn đồng ý. Cụ thể như sau: Mức 1: Hoàn toàn không đồng ý Mức 2: Không đồng ý Mức 3: Bình thường Mức 4 : Đồng ý Mức 5: Hoàn toàn đồng ý Mỗi câu hỏi sẽ là một phát biểu về một tiêu chí được xem là cơ sở cho việc đánh giá lựa chọn điểm đến du lịch Bình Thuận của du khách. Với cách thiết kế như vậy, KDL khi được khảo sát sẽ cho biết đánh giá của bản thân về những yếu tố ảnh hưởng đến việc lựa chọn điểm đến du lịch Bình Thuận. Bảng câu hỏi chính thức sau khi thảo luận nhóm gồm có 30 câu hỏi tương ứng với 6 yếu tố được cho là có ảnh hưởng đến việc lựa chọn điểm đến du lịch Bình Thuận của du khách. 19 MÃ HÓA THANG ĐO TRONG MÔ HÌNH 1. Thang đo về nguồn nhân lực du lịch được ký hiệu là NNL gồm 5 biến quan sát ký hiệu NNL1 đến NNL5 và được đo bằng thang đo Likert 5 mức độ. 2. Thang đo về giá cả dịch vụ hợp lý được ký hiệu là GCHL gồm 5 biến quan sát ký hiệu GCHL1 đến GCHL5và được đo b ằng thang đo Likert 5 mức độ 3. Thang đo về sự đa dạng sản phẩm, dịch vụ được ký hiệu là SPDV gồm 5 biến quan sát ký hiệu SPDV1 đến SPDV5 và được đo bằng thang đo Likert 5 mức độ. 4. Thang đo về điểm đến an toàn được ký hiệu là DDAT gồm 5 biến quan sát ký hiệu DDAT1 đến DDAT5 và được đo bằng thang đo Likert 5 mức độ. 5. Thang đo Môi trường tự nhiên được ký hiệu là MTTN gồm 5 biến quan sát ký hiệu MTTN1 đến MTTN5 và được đo bằng thang đo Likert 5 mức độ. 6. Thang đo Cơ sở hạ tầng du lịch được ký hiệu là CSHT gồm 5 biến quan sát ký hiệu CSHT1 đến CSHT5 và được đo bằng thang đo Likert 5 mức độ. 20 CHỌN MẪU NGHIÊN CỨU ĐỊNH LƯỢNG Có nhiều công thức lấy mẫu, tuy nhiên, các công thức lấy mẫu phức tạp tác giả sẽ không đề cập trong tài liệu này bởi vì nó thiên về toán thống kê. Nếu lấy mẫu theo các công thức đó, lượng mẫu nghiên cứu cũng là khá lớn, hầu như chúng ta không đủ thời gian và nguồn lực để thực hiện. Do vậy, đa phần chúng ta lấy mẫu trên cơ sở tiêu chuẩn 5:1 của Bollen (1989)1, tức là để đảm bảo phân tích dữ liệu (phân tích nhân tố khám phá EFA) tốt thì cần ít nhất 5 quan sát cho 1 biến đo lường và số quan sát không nên dưới 100. Mô hình có 6 nhân tố và 30 biến quan sát (các câu hỏi sử dụng thang đo Likert), do vậy mẫu tối thiểu sẽ là 30 x 5 = 150 . * Lưu ý, mẫu này là mẫu tối thiểu chứ không bắt buộc chúng ta lúc nào cũng lấy mẫu này, mẫu càng lớn thì nghiên cứu càng có giá trị. Cụ thể trong nghiên cứu này, tác giả lấy mẫu là 325 . 21 VD: Thực hiện nghiên cứu định lượng mô hình nghiên cứu Các yếu tố ảnh hưởng đến lựa chọn điểm đến du lịch BT Mô tả Số lượng (bảng) Tỷ lệ (%) Số bảng câu hỏi phát ra 325 100 Số bảng câu hỏi thu về 325 100 Trong đó Số bảng câu hỏi hợp lệ 301 92,62 Số bảng câu hỏi không hợp lệ 24 7,38 22 Kiểm định độ tin cậy Cronbach’s Alpha 1 . Lý thuyết về giá trị và độ tin cậy của đo lường Một đo lường được coi là có giá trị (validity) nếu nó đo lường đúng được cái cần đo lường (theo Campbell & Fiske 1959). Hay nói cách khác, đo lường đó sẽ không có hiện tượng sai số hệ thống và sai số ngẫu nhiên. • Sai số hệ thống: sử dụng thang đo không cân bằng, kỹ thuật phỏng vấn kém • Sai số ngẫu nhiên: phỏng vấn viên ghi nhầm số đó của người trả lời, người trả lời thay đổi tính cách nhất thời như do mệt mỏi, đau yếu, nóng giận làm ảnh hưởng đến câu trả lời của họ. Trên thực tế nghiên cứu, chúng ta sẽ bỏ qua sai số hệ thống và quan tâm đến sai số ngẫu nhiên. Khi một đo lường vắng mặt các sai số ngẫu nhiên thì đo lường có độ tin cậy (reliability). Vì vậy, một đo lường có giá trị cao thì phải có độ tin cậy cao. 23 Kiểm định độ tin cậy Cronbach’s Alpha 2 . Đo lường độ tin cậy bằng hệ số Cronbach’s Alpha - Cronbach (1951) đưa ra hệ số tin cậy cho thang đo. Chú ý, hệ số Cronbach’s Alpha chỉ đo lường độ tin cậy của thang đo (bao gồm từ 3 biến quan sát trở lên) chứ không tính được độ tin cậy cho từng biến quan sát.( Cronbach’s Alpha chỉ thực hiện khi nhân tố có 3 biến quan sát trở lên trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 355.) - Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn [0,1]. Về lý thuyết, hệ số này càng cao càng tốt (thang đo càng có độ tin cậy cao). Tuy nhiên điều này không hoàn toàn chính xác. Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) cho thấy có nhiều biến trong thang đo không có khác biệt gì nhau, hiện tượng này gọi là trùng lắp trong thang đo.( Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) gây ra hiện tượng trùng lắp trong thang đo trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 364.) 24 Tính hệ số tin cậy Cronbach’s Alpha bằng SPSS 3 . Các tiêu chuẩn kiểm định - Nếu một biến đo lường có hệ số tương quan biến tổng Corrected Item – Total Correlation ≥ 0.3 thì biến đó đạt yêu cầu. ( Tương quan biến tổng ≥ 0.3 trích nguồn từ: Nunnally, J. (1978), Psychometric Theory, New York, McGraw- Hill.) - Mức giá trị hệ số Cronbach’s Alpha: • Từ 0.8 đến gần bằng 1: thang đo lường rất tốt. • Từ 0.7 đến gần bằng 0.8: thang đo lường sử dụng tốt. • Từ 0.6 trở lên: thang đo lường đủ điều kiện. - Chúng ta cũng cần chú ý đến giá trị của cột Cronbach's Alpha if Item Deleted, cột này biểu diễn hệ số Cronbach's Alpha nếu loại biến đang xem xét. Thông thường chúng ta sẽ đánh giá cùng với hệ số tương quan biến tổng Corrected Item – Total Correlation, nếu giá trị Cronbach's Alpha if Item Deleted lớn hơn hệ số Cronbach Alpha và Corrected Item – Total Correlation nhỏ hơn 0.3 thì sẽ loại biến quan sát đang xem xét để tăng độ tin cậy của thang đo. 25 Kết quả nghiên cứu định lượng Hệ số Cronbach alpha Cronbach's Alpha yếu tố nguồn nhân lực = 0.880 1 Cronbach's Alpha yếu tố giá cả = 0.764 2 3 Cronbach's Alpha yếu tố đa dạng SPDV = 0.839 4 Cronbach's Alpha yếu tố điểm đến an toàn = 0.812 5 Cronbach's Alpha yếu tố môi trường = 0.843 6 Cronbach's Alpha yếu tố hạ tầng = 0.836 26 Phân tích nhân tố khám phá EFA - Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn . - Hai giá trị quan trọng được xem xét trong EFA là giá trị hội tụ và giá trị phân biệt . (Hai giá trị quan trọng trong phân tích nhân tố khám phá EFA bao gồm: giá trị hội tụ và giá trị phân biệt. Trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 378.) Hiểu một cách đơn giản: 1. Thỏa mãn "Giá trị hội tụ": Các biến quan sát hội tụ về cùng một nhân tố. 2. Đảm bảo "Giá trị phân biệt": Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác. Các tiêu chí trong phân tích EFA - Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì: • Factor Loading ở mức  0.3: Điều kiện tối thiểu để biến quan sát được giữ lại. • Factor Loading ở mức  0.5: Biến quan sát có ý nghĩa thống kê tốt. • Factor Loading ở mức  0.7: Biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau. Các tiêu chí trong phân tích EFA - Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì: • Factor Loading ở mức  0.3: Điều kiện tối thiểu để biến quan sát được giữ lại. • Factor Loading ở mức  0.5: Biến quan sát có ý nghĩa thống kê tốt. • Factor Loading ở mức  0.7: Biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau. Các tiêu chí trong phân tích EFA - Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì: • Factor Loading ở mức  0.3: Điều kiện tối thiểu để biến quan sát được giữ lại. • Factor Loading ở mức  0.5: Biến quan sát có ý nghĩa thống kê tốt. • Factor Loading ở mức  0.7: Biến quan sát có ý nghĩa thống kê rất tốt. Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau. Phân tích tương quan - Sau khi đã có được các biến đại diện độc lập và phụ thuộc ở phần phân tích nhân tố EFA, chúng ta sẽ tiến hành phân tích tương quan Pearson để kiểm tra mối quan hệ tuyến tính giữa các biến này ( ký hiệu là r) được thực hiện để xem xét mối quan hệ giữa các biến độc lập với biến trong mô hình nghiên cứu (Phân tích tương quan được thực hiện trước khi phân tích hồi quy bội), và để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng. r nằm trong khoảng -1 ≤ r ≤ 1 (Trọng và Ngọc, 2008, tr.197, tập 1). Một số lưu ý phân tích Pearson: Tương quan Pearson r có giá trị dao động từ -1 đến 1: • Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm. • Nếu r càng tiến về 0: tương quan tuyến tính càng yếu. • Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng. • Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến. . Trên Bảng trên đây minh họa cho kết quả tương quan Pearson của nhiều biến đưa vào cùng lúc trong SPSS. Trong bảng kết quả tương quan Pearson ở trên: Hàng Pearson Correlation là giá trị r để xem xét sự tương thuận hay nghịch, mạnh hay yếu giữa 2 biến. Hàng Sig. (2-tailed) là sig kiểm định xem mối tương quan giữa 2 biến là có ý nghĩa hay không. Sig < 0.05, tương quan có ý nghĩa; sig ≥ 0.05, tương quan không có ý nghĩa. Cần xem xét sig trước, nếu sig < 0.05 mới nhận xét tới giá trị tương quan Pearson r. Hàng N hiển thị cỡ mẫu của tập dữ liệu. Phân tích hồi quy đa biến - Khác với tương quan Pearson, trong hồi quy các biến không có tính chất đối xứng như phân tích tương quan. Vai trò giữa biến độc lập và biến phụ thuộc là khác nhau. X và Y hay Y và X có tương quan với nhau đều mang cùng một ý nghĩa, trong khi đó với hồi quy, ta chỉ có thể nhận xét: X tác động lên Y hoặc Y chịu tác động bởi X. - Đối với phân tích hồi quy tuyến tính bội, chúng ta giả định các biến độc lập X1, X2, X3 sẽ tác động đến biến phụ thuộc Y. Ngoài X1, X2, X3 còn có rất nhiều những nhân tố khác ngoài mô hình hồi quy tác động đến Y mà chúng ta không liệt kê được. Các tiêu chí trong phân tích hồi quy - Giá trị R2 (R Square), R2 hiệu chỉnh (Adjusted R Square) phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy. R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức dao động của 2 giá trị này là từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là gần như không tưởng dù mô hình đó tốt đến như: Giá trị sig của kiểm định F được sử dụng để kiểm định độ phù hợp của mô hình hồi quy. Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử đụng được. Giá trị này thường nằm trong bảng ANOVA. Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau). Các tiêu chí trong phân tích hồi quy - Hệ số k’ là số biến độc lập đưa vào chạy hồi quy, N là kích thước mẫu. - Giá trị sig của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu sig kiểm định t của hệ số hồi quy của một biến độc lập nhỏ hơn 0.05, ta kết luận biến độc lập đó có tác động đến biến phụ thuộc. Mỗi biến độc lập tương ứng với một hệ số hồi quy riêng, do vậy mà ta cũng có từng kiểm định t riêng. Giá trị này thường nằm trong bảng Coefficients . Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến. - Kiểm tra các giả định hồi quy, bao gồm phần dư chuẩn hóa và liên hệ tuyến tính ( căn cứ vào biểu đồ Histogram và Normal P-P Plot). Phương trình hồi quy: Y= ao + a1*X1 + a2*X2 +a3*X3 +a4*X4 +a5*X5 +a6*X6. Trong đó : Y : Sự lựa chọn điểm đến du lịch Bình Thuận của du khách X1 : Nguồn nhân lực X2 : Giá cả dịch vụ hợp lý X3 : Sự đa dạng về các sản phẩm dịch vụ X4 : Điểm đến an toàn X5 : Môi trường tự nhiên X6 : Cơ sở hạ tầng 35 Phân tích hồi quy đa biến Đánh giá mức độ phù hợp của mô hình hồi quy tuyến tính đa biến 36 Mô hình Hệ số R Hệ số R 2 Hệ số R2 - hiệu chỉnh Sai số chuẩn của ước lượng Thống kê thay đổi Hệ số Hệ số R 2 sau khi đổi Hệ số F khi đổi Bậc tự do 1 Bậc tự do 2 DurbinWatson 1 .836 a .699 .693 .27532 .699 113.901 6 294 2.085 a Biến độc lập: (Constant) NL, GC, SP, AT, MT, CSHT b Biến phụ thuộc: Y FinV (0.05,6.301) =2.1288 Kiểm định mô hình hồi quy tuyến tính đa biến Mô hình Hệ số chưa chuẩn hóa Hệ số chuẩn hóa t Sig. Thống kê đa cộng tuyến B Sai số chuẩn Beta Hệ số Tolerance Hệ số VIF (Constant) -.369 .145 -2.550 .011 NL .172 .015 .373 11.511 .000 .975 1.026 GC .260 .032 .310 8.020 .000 .685 1.459 SP .211 .035 .254 6.066 .000 .584 1.712 AT .182 .024 .245 7.614 .000 .985 1.015 MT .100 .032 .126 3.096 .002 .622 1.608 CSHT .193 .028 .254 6.873 .000 .748 1.337 Biến phụ thuộc: sự lựa chọn (Y) 37 Sự lựa chọn du khách = + 0.373 * Nguồn nhân lực + 0.310 *Giá cả dịch vụ hợp lý + 0.254 * Đa dạng SP-DV + 0.254 * Cơ sở hạ tầng + 0.245 * Điểm đến an toàn + 0.126 * Môi trường tự nhiên 38 Mức độ quan trọng và Kiểm đị nh của từng yếu tố 39 Một số hàm ý quản trị Yếu tố giá cả dịch vụ hợp lý Yếu tố nguồn nhân lực Yếu tố đa dạng SPDV Yếu tố môi trường tư nhiên Yếu tố hạ tầng Yếu tố điểm đến an toàn Sự lựa chọn điểm đến của du khách

Các file đính kèm theo tài liệu này:

bai_giang_phuong_phap_nghien_cuu_khoa_hoc_bai_5_xu_ly_thong.pptx