SPSS 16:
SPSS: Statistical Package for Social Sciences
Sách, giáo trình
Phân tích dữ liệu nghiên cứu với SPSS 1 & 2 – Hoàng Trọng, Chu Nguyễn Mộng Ngọc
Dự báo và phân tích dữ liệu trong kinh tế và tài chính – Nguyễn Trọng Hoài, Phùng Thanh Bình, Nguyễn Khánh Duy
90 trang |
Chia sẻ: Mr Hưng | Lượt xem: 933 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Xử lý và phân tích dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
XỬ LÝ & PHÂN TÍCH DỮ LIỆUTS. Nguyễn Duy ThụcĐại học Sài Gòn1SPSSSPSS 16:SPSS: Statistical Package for Social SciencesSách, giáo trìnhPhân tích dữ liệu nghiên cứu với SPSS 1 & 2 – Hoàng Trọng, Chu Nguyễn Mộng NgọcDự báo và phân tích dữ liệu trong kinh tế và tài chính – Nguyễn Trọng Hoài, Phùng Thanh Bình, Nguyễn Khánh Duy2Giới thiệuPhần I:DỮ LIỆU THỐNG KÊMột nghiên cứu định lượng vấn đề kinh tế xã hội thường bao gồm các bước cơ bản sau:Xác định vấn đề nghiên cứuThu thập dữ liệuXử lý dữ liệu Phân tích dữ liệuBáo cáo kết quả4Nghiên cứu và phân tích dữ liệuChia làm hai loạiDữ liệu định lượng: loại dữ liệu này phản ánh mức độ, mức độ hơn kém, tính được các giá trị đặc trưng. Nó thể hiện bằng con số thu thập đượcThang đo khoảng cáchThang đo tỉ lệDữ liệu định tính: loại dữ liệu này phản ánh tính chất, sự hơn kém, ta không tính được các giá trị trung bình, độ biến động của loại nàyThanh đo định danh(nominal)Thang đo thứ bậc(ordinal)5Phân loại dữ liệu1. Loại điện thoại di động mà bạn sử dụng chính? Nokia Samsung Iphones Khác2. Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên? Rất không hài lòng 1 2 3 4 5 Rất hài lòng3. Chi tiêu trung bình một tháng cho việc gọi điện thoại di động .ngàn đ4. Bạn theo dõi thông tin về các loại điện thoại mới như thế nào? Không bao giờ Ít khi Thỉnh thoảng Thường xuyên5. Bạn thường sử dụng tính năng nàoNghe - gọi Tin nhắn Nghe nhạc Quay phim, chụp hình Games Khác6. Giới tính: Nam Nữ6Ví dụThang đo định danh: Là loại thang đo dùng mã số để phân loại các đối tượng, chúng không mang ý nghĩa nào khác. Ví dụ: Hãy cho biết tình trạng hôn nhân của anh chị hiện nay:Độc thân 1Đang có gia đình 2Ly thân hoặc ly dị 3Goá 4Thang đo thứ bậc: Thường được sử dụng cho các tiêu thức thuộc tính và cũng được áp dụng nhiều cho tiêu thức số lượng. trong thang đo này giữa các biểu hiện của tiêu thức có quan hệ thứ bậc hơn kém. Sự chênh lệch giữa các biểu hiện không nhất thiết là bằng nhau7Các thang đo cơ bảnVí dụ: bạn đo lường cảm nhận của một người về môi trường sống xung quanhTốt 1Bình thường 2Không hài lòng 3Thang đo khoảng: là dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc. Thông thường của thang đo này có dạng là một dãy các chữ số liên tục và đề đặn từ 1 đến 5, 7 hoặc 10. dãy số này có hai cực ở hai đầu đối lập nhau8Bạn nhận thấy dịch vụ điện hoa nhân ngày Valentine như thế nào:Rất hài lòng 1Hài lòng 2Bình thường 3Không hài lòng 4Rất không hài lòng 5Thang đo tỉ lệ: có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra điểm 0 trong đang đo này là có thật nên ta có thể thực hiện được phép toán chiaVí dụ : bạn bao nhiêu tuổi9Nguyên tắc này được mô tả tóm tắt trong bảng sau:Với mục tiêu nhập dữ liệu để phân tích và tính toán thì chúng ta cần mã hoá các biến định tính.Với một ma trận dữ liệu mỗi cột cho 1 biến, mỗi hàng là thông tin từng người.10Nguyên tắc mã hoá và nhập liệuSTTLoại hình DNSố lao độngLĩnh vực kinh doand1TNHH300Gỗ2Cổ phần500Gạch3Hợp danh450Thuỷ sảnnTNHH470Dệt mayDữ liệu được mã hoá có thể là như sau:Trong phần lớn trường hợp thì mỗi biến tương ứng với một câu hỏi. Nếu câu hỏi mà chỉ có một câu trả lời thì chỉ cần một biến. Còn với câu hỏi cần nhiều câu trả lời thì cần nhiều biến số.11STTLoại hình DNSố lao độngLĩnh vực kinh doand1230010235005314509n247081-nam, 2-nữ,Thông thường mỗi biến tương ứng với một câu hỏi điều tra.Nếu câu hỏi có nhiều trả lời:2 cách mã hóa. 12Giới tínhTuổiNghề nghiệp12231022213313211..n14214Câu 1: Giới tính của bạn là gì: Nam 1 Nữ 2Câu 2: Trong vòng 2 năm qua bạn đã đi du lịch ở những nơi nào sau đây:Đà lạt Nha trang Vũng tàu Cần thơ Bà nà Huế Nơi khác 13Đặt biến số từ câu hỏi có nhiều câu trả lờiCách 1: đặt theo từng cặpC2a: Bạn đi du lịch ở Đà Lạt Đã đi 1 Chưa đi 0C2b: Bạn đi du lịch ở Nha trang Đã đi 1 Chưa đi 0C2c: Bạn đi du lịch ở Vũng tàu Đã đi 1 Chưa đi 014Cách 2: mã hoá các phạm trù và đặt biến dựa theo số lượng phạm trù nhiều nhấtĐà lạt 1Nha trang 2Vũng tàu 3Cần thơ 4Bà nà 5Huế 6Nơi khác 7Các biến sẽ là:C2a: Bạn đã từng đi du lịch ở nơi nào trong 2 năm qua.C2b: Bạn đã từng đi du lịch ở nơi nào trong 2 năm quaC2c: Bạn đã từng đi du lịch ở nơi nào trong 2 năm qua.Chú ý: số lượng biến được dựa trên người có lựa chọn nhiều nhất.15Trong việc lựa chọn các điểm tham quan: nhiều nhất có 3 sự lựa chọn ta có 3 biến như trên:Cách vào số liệu:Người 1 chọn: Nha Trang, Cần Thơ, HuếNgười 2 chọn: Cần thơ, Nơi khácNgười 3 chọn: Đà Lạt16Ví dụ:STTc2ac2bc2c12462473117Cửa sổ làm việc của SPSSFile:Tạo mới, mở file, lưu, in, thoátEdit: undo, cắt/dán, tìm kiếm/thay thếView: hiện dòng trạng thái, thanh công cụ, chọn font chữ, .Data: các lựa chọn cho dữ liệuTransform: Chuyển đổi, tính toán, mã hóa dự liệu.. Analyze: Thực hiện các thủ tục thống kê.Graphs:tạo đồ thịUtilities: tìm hiểu thông tin về các biếnWindows: sắp xếp các cửa sổ của SPSS18Cửa số làm việc của SPSSNhập số liệu trong Excel rồi copy sang SPSSNhập trực tiếp từ SPSS19Tạo tập tin dữ liệu trong SPSSĐịnh dạng các biến được khai báoTrong phần Variable View có các lựa chọn sau đây:Name: tên biến, không quá 8 kí tự, không có kí tự đặc biệt và không được bắt đầu bằng kí tự sốType: Kiểu biến, mặc định là chọn kiểu định lượng NumericLabel: đặt nhãn cho biến, nhãn này nên ngắn gọn và có tính giải thích cao. (có thể gõ tiếng Việt)Value: trong hộp này khai báo những nội dung liên quan đến việc mã hoá biến định tính.Mising: khai báo các giá trị khuyết, các giá trị không có câu trả lời (chọn một số khác hẳn so với các số ta đã mã hoá ở Value). Ví dụ quy ước 77 là “Không trả lời” ở phần Value thì ở đây ta nhập 77 cho biến đó. Ngoài ra còn có System missing, đó là giá trị khuyết của hệ thống, nó được tự động đặt dấu (.). Giá trị này là vô hình đối với các lệnh xử lý.20Columns: khai báo độ rộng của cột biến khi ta nhập số liệu, thường là 8Align: vị trí dữ liệu nhập trong cột, thường chọn rightMeasure: chọn loại thang đo, Ordinary (thang đo thứ bậc) Norminal (thang đo định danh) Scale (cả thang đo khoảng cách và thang đo tỉ lệ)Lưu ý: ta có thể copy thuộc tính của một biến số cho biến số khác bằng tổ hợp phím Ctrl C và Ctrl VTrong SPSS 16 trở đi ta có thể gõ tiếng Việt bằng cách chọn menu Edit Options thẻ General mục Character Encording for Data and Syntax unicode ok21Mã hoá lại biến số (Recode)Chúng ta muốn giảm số phạm trù của biếnMuốn chuyển một biến định lượng thành biến định tính (phân tổ những câu trả lời, phân tổ thống kê)Quy trình thực hiện:Vào Transform Recode into same variables (nếu muốn mã hoá lại biến thay thế cho biến cũ) hoặc Recode into different variables (mã hoá lại biến nhưng tạo thêm biến số mới, biến cũ vẫn giữ nguyên)22Một số xử lý trên biếnTrong hộp thoại này, lần lượt khai báo phần giá trị cũ (Old value) tương ứng với từng giá trị mới (New value)Value: từng giá trị cũ rời rạc ứng với 1 giá trị mớiSystem missing: giá trị khuyết của hệ thốngSystem or user missing: giá trị khuyết của hệ thống hoặc do người sử dụng định nghĩaRange: một khoảng giá trị cũ ứng với một giá trị mới, có 3 trường hợp con.Mỗi lần xác định xong một cặp giá trị mới và cũ thì nút Add sẽ sáng lên23Chuyển biến dạng Category thành dạng DichotomyBiến Category là dạng biến có nhiều trị số mã hoá tượng trưng cho nhiều phạm trùBiến dạng Dichotomy là biến dạng chỉ có hai trị sốCách chuyển:Chọn menu Transform Count values within cases2425Mã hoá lại biến thay cho biến cũMã hóa lại biến lưu lại trên biến mới26Ví dụ mã hóa lại biến tuổiBiến được mã hoá lạiTên biến mớiNhãn của biến mớiNhập lại giá trị của biến mới2728Chọn Range lowes, đánh 25(từ 25 trở xuống)Chọn New value đánh vào ô value: 1 add. Chọn Range, value through, đánh 25(từ 25 trở xuống lên)Chọn New value đánh vào ô value: 2 add.ContinuechangeokSau bước này ta có biến mới: tuoirecode29Dữ liệu sau khi nhập xong thường chưa thể đưa ngay vào xử lý và phân tích vì còn có thể có các lỗi: chất lượng của phỏng vấn và đọc soátLSDL nhằm:phát hiện ô trống hoặc trả lời không hợp lý.Các phương pháp làm sạch:Dùng bảng tần sốDùng bảng phối hợp 2 hoặc 3 biến. Ví dụ khi ta lập bảng biến tuổi và nghề nghiệp, nếu có quan sát 10 tuổi song nghề nghiệp lại làm giảng viên thì cần xem lạiVào Menu Data Select Cases. Trong hộp thoại này chọn If condition is satisfied để chỉ định cho SPSS lọc ra các trường hợp thoả điều kiện. Việc này tạo ra biến mới là filter_$ nhận giá trị 1 nếu quan sát thoả điều kiện của lệnh if và 0 nếu ngược lạiCách tìm lỗi ngay trên cửa sổ dữ liệu bằng lệnh Sort case 30Làm sạch dữ liệu(LSDL)Tính toán số người đọc báo trẻChọn Trans formcount values winthin casessTarget value:doctuoitre Target label: doc bao tuoi tre chuyển c2a1đến c2a9 vào bảng numeric variables difine value Chọn value:7 add continue ok31Ví dụ32Khu vực đưa các biến Category vàoTên và nhãn của biến DichotomyXác định giá trịLựa chọn giới tính = NamChọn Data Select cases if condition is Satisfied if Chuyển biến gioitinh vào bảng bên phải continue okSau khi phân tích lặp lại Data Select cases all case trả lại dữ liệu gốc33Chọn dữ liệu theo điều kiện3435Sau khi xem xong trở bảng select casesChọn all cases ok để trả lại bảng số liệu ban đầu36Phần IITÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊCác công cụ cơ bản:Bảng tần sốCác đại lượng thống kê cơ bảnBảng kết hợp nhiều biếnĐồ thịTuỳ chỉnh kiểu hiển thị bảng biểu:Để tiện cho việc in ấn, sử dụng bạn có thể thay đổi một số mặc định của chương trình trong hộp thoại Options. Từ menu chọn Edit Options trong thẻ Pivot Table bạn có thể chọn các kiểu định dạng bảng ưu thích trong ô TableLook38Bảng tần số đơn giảnCách tiến hành: Mở file dữ liệu, chọn Analyze Descriptive Statistics FrequenciesLựa chọn các đại lượng trong Statistics ., trong Charts . Hay trong Format. Sau đó nhấn OK39Ta có kết quả:Trong đó: cột frequency là tần số của từng biểu hiện; cột percent là % , cột valid percent là % hợp lệ, cột Cumulative percent là tần suất tích luỹ.Lưu ý: có thể thực hiện bảng tần số với tất cả biến định tính và biến định lượng.Cũng có thể vừa lập bảng tần số vừa tính toán các đại lượng thống kê mô tả4041Tính toán các đại lượng thống kê mô tả:Cách làm:Vào Menu Analyze Descriptive Statistics DescriptiveLựa chọn Options ta sẽ có được các đại lượng cần tính toán42Bảng kết quả sau khi Ok như sau:Trong trường hợp tính toán nhiều biến một lúc, bạn có thể chọn một trong 4 cách sắp xếp biến ở mục Display OrderNếu bảng kết quả có bề ngang quá rộng, bạn có thể lựa chọn lại cách trình bày ngay trong cửa sổ Output (đưa con trỏ chuột vào vị trí bảng, nhấp đúp, sau đó trong menu Pivot bạn chọn Transpose Row and Columns)43Thống kê mô tả với thủ tục ExploreCác thủ tục thống kê mô tả chỉ có tác dụng cho việc tổng hợp một biến định lượng được đo lường đơn. Ví dụ nếu bạn muốn tìm ra những khác biệt trong các đại lượng thống kê mô tả của biến tuoi giữa các nhóm đối tượng khác nhau về giới tính hoặc khu vực địa lý thì cần sử dụng thủ tục ExploreThủ tục này có tác dụng:Tính toán các đại lượng thống kê mô tả cho tất cả các trường hợp trong dữ liệu hoặc cho các nhóm con của chúngNhận diện các giá trị khác biệtTạo biểu đồ, hình dáng của đồ thị sẽ cho biết dữ liệu phân phối thế nào44Thủ tục ExploreCách thực hiện: vào menu Analyze Descriptive Statistics Explore mở hộp thoại Explore45Chọn một hay nhiều biến định lượngChọn một hay nhiều biến định tính làm điều kiện để phân tích biến định lượng(biến ở dạng Categorical)Lựa chọn statistics46Mặc định lựa chọn sẵn, tính tất cả các đại lượng thống kê mô tảLà ước lượng cho khuynh hướng tập trung có phân biệt trọng số cho các giá trị khác nhauThể hiện 5 giá trị lớn nhất và 5 giá trị nhỏ nhất của biến được đưa vào khung Dependent ListThể hiện các thập phân vị thứ 5, 10, 25, 50, 75, 90 và 95Lựa chọn Plot47Khu vực cho biết về dạng biểu đồ thân và lá và biểu đồ histogramVẽ biểu đồ xác suất chuẩn Q – Q plot giúp kiểm tra có phân phối chuẩn hay khôngCho phép lựa chọn cách thể hiện biểu đồ hộp BoxplotLựa chọn Options48Những trường hợp có giá trị thiếu ở bất kỳ biến nào trong các biến được đưa vào đều bị bỏ quaMỗi phép toán thống kê hay đồ thị sẽ sử dụng tất cả các trường hợp không có thông tin bị thiếu tại các biến cần cho việc tính toán chúngLập bảng tổng hợp nhiều biếnBảng kết hợp các biến định tính:Chọn menu Analyze Tables Custom Tables49Chọn các biến số lập bảng bằng cách kéo thả vào vị trí Columns hoặc Rows (không giới hạn biến)Cho phép ghi tiêu đề của bảng và chú thích của bảngNhấp đúp vào vị trí này để thêm các đại lượng thống kê mô tảBảng 1 biếnChọn Analyze > Tables > Custom TablesChọn biến TP chuyển vào khung Variables vào ô Rows > Summary Statistics > Chọn Column N % chuyển sang bảng Display > apply to Selection > Categories and Taotals > Total trong mục Show ở cuối hộp > apply > ok 50Ví dụ: Lập bảng TP và giới tính(Data thuc hanh)Chọn Analyze > Tables > Custom TablesChọn biến TP chuyển vào khung Variables vào ô columns > Summary Statistics > Chọn Column N % chuyển sang bảng Display > apply to Selection > Chọn gioitinh chuyển vào khung Variables vào ô Rows > Categories and Taotals > Total trong mục Show ở cuối hộp > apply > ok51Bảng 2 biếnXử lý câu hỏi có nhiều câu trả lời (Multiple Answer)Ví dụ có phân tích về các loại báo thường đọc, người trả lời có thể lựa chọn nhiều loại báo khác nhau. Ta sẽ dùng bảng cho một câu hỏi có nhiều câu trả lờiTừ menu Analyze Mult Response frequencies chọn biến cần tính vào table(s) exclude cases listwise within dichotomiess ok52Thống kê câu hỏi nhiều lựa chọn5354Ta có hộp thoại sau55Chọn các biến số của cùng một câu trả lời và đưa sang khu vực nàyChọn Dichotomies nếu biến có 2 biểu hiện và chọn Categories nếu có nhiều biểu hiệnĐặt tên và nhãn cho biến mớiNhấn nút Add sau khi đã làm xong các bước trênSau khi định nghĩa xong ta có thể tiếp tục làm cho các biến khác56Các biến có nhiều câu trả lời và các phạm trù của nóTrình bày kết quả bằng đồ thịCác loại đồ thị trong SPSS Biểu đồ Bar được dùng biểu diễn dữ liệu dưới dạng tần số hoặc tần suất Biểu đồ hình tròn Pie: thường dùng khi biểu diễn dữ liệu định tính dạng tần số hay % khi chỉ có ít nhómĐồ thị đường gấp khúc Line, diện tích Area: áp dụng cho dữ liệu định lượng Chọn menu Graphs Chart Builder 57Đồ thị 58Lựa chọn biến muốn vẽ đồ thị kéo sang vị trí muốn hiển thịCác lựa chọn liên quan đến chi tiết của đồ thị, tiêu đề đồ thịCác kiểu đồ thịNhấn Ok sau khi đã xong các bước trênHiệu chỉnh đồ thịNhấp đúp vào đồ thị mở ra cửa sổ Chart Editor ta có thể có các tuỳ chọn để điều chỉnh.Chuyển đổi giữa các loại đồ thị: Nhấp đúp chuột vào đồ thị chọn kiểu muốn chuyển đổi trong Element TypeLưu đồ thị: có thể copy dán sang Word, hay ExcelLưu chính file OutputTừ cửa sổ Chart Editor chọn menu File Export ChartCách tốt nhất là vẽ đồ thị trong Excel, vì có thể hiệu chỉnh rõ ràng, đẹp, nhanh, đơn giản và có thể tạo liên kết link với file Power Point.59Phần IIIMỘT SỐ PHÂN TÍCH CƠ BẢN CỦA THỐNG KÊ DÙNG SPSSKiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậcCặp giả thiết cần kiểm định: H0 : hai biến A và B độc lập với nhau H1 : hai biến A và B có liên hệ với nhauGiả sử hai biến này có bảng tần số kết hợp như sau:61Kiểm định mối liên hệ giữa hai biến định tínhBảng tần số của hai biến A và BTiêu chuẩn kiểm định: 62Miền bác bỏ:Việc thực hiện SPSS như sau:Chọn menu Analyze Descriptive Statistics Crosstabs 63Chọn các biến cần kiểm định mối quan hệ vào hai ô nàyCác lựa chọn về thống kê kiểm định tại đâyKết quả:Giá trị Chi-square là 7,248 với bậc tự do là 3Giá trị Asymp Sig là p_value. Nếu p_value 0,05 thì với mức ý nghĩa 5% ta chưa đủ cơ sở bác bỏ H0, vậy mức độ hài lòng là như nhau67Sig = 0,836> 0,05 nghĩa là phương sai giữa các nhóm học vấn không khác nhau một cách có ý nghĩa cho nên kiểm định ANOVA thực hiện đượcXem xét mối quan hệ tương quan giữa hai biến định lượng qua ví dụ về mối quan hệ giữa doanh số bán hàng và chi phí chào hàng (file tqvahd)Cách thực hiện bằng SPSSChọn menu Analyze Correlate BivariateHệ số tương quan Pearson được tính theo công thứcVà r cho biết mức độ chặt chẽ của mối liên hệ tuyến tính. Giá trị r = 0 khi hai biến không có mối liên hệ tuyến tính68Tương quan và hồi quy69Một vài lựa chọn thống kêĐưa hai biến số vào đây Lựa chọn tính hệ số tương quan hạng (trường hợp tổng thể không phân phối chuẩn)Kết quả của hệ số tương quan Pearson70Hệ số tương quan được thể hiện trong mỗi ôSig (2-tailed) là của giả thiết H0 : hệ số tương quan bằng 0 H1 : hệ số tương quan khác 0Dấu * thể hiện mức ý nghĩa nhỏ hơn 0,05 (5%) và dấu ** thể hiện mức ý nghĩa nhỏ hơn 0,01 (1%)Kết quả của hệ số tương quan hạng Spearman71Hệ số tương quan hạng được thể hiện trong mỗi ôSig (2-tailed) là của giả thiết H0 : hệ số tương quan bằng 0 H1 : hệ số tương quan khác 0Dấu * thể hiện mức ý nghĩa nhỏ hơn 0,05 (5%) và dấu ** thể hiện mức ý nghĩa nhỏ hơn 0,01 (1%)Hồi quy tuyến tính (file Hoi quy boi)Cách thực hiện bằng SPSSChọn Analyze regression linear 72Biến phụ thuộc và biến độc lậpCác tuỳ chọn liên quan đến giá trị ước lượng, độ tin cậy, đồ thịKết quả73Phân tích EFA là tên chung của một nhóm các thủ tục được sử dụng chủ yếu để thu nhỏ và tóm tắt các dữ liệu. Liên hệ giữa các nhóm biến có quan hệ qua lại lẫn nhau được xem xét và trình bày dưới dạng một số ít các nhân tố cơ bản.Phân tích này được dùng trong những trường hợp sau:Nhận diện các nhân tố giải thích được các liên hệ tương quan trong một tập biếnNhận diện một tập biến mới không có tương quan với nhau để thay thế cho tập biến cũNhận diện một số ít các nhân tố chính nổi trội74Phân tích nhân tố khám phá (EFA)Các tham số thống kê dùng trong phân tích nhân tố:Bartlet’s test of sphericity: dùng để xem xét giả thuyết các biến không có tương quan trong tổng thểCorrelation matrix: hệ số tương quan giữa các cặp biến trong phân tíchCommunality: là lượng biến thiên của một biến được giả thích chung với các biến khác được xem xét trong phân tíchEigenvalue: đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố.Factor loadings (hệ số tải): là những hệ số tương quan đơn giữa các biến và các nhân tốFactor matrix: chứa các hệ số tải nhân tố75Factor scores: là các điểm số nhân tố tổng hợp được ước lượng cho từng quan sát trên các nhân tố được rút ra. Còn gọi là nhân sốKaiser-Meyer-Olkin (KMO) measure of sampling adequacy: là chỉ số dùng xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO lớn (giữa 0,5 và 1) là đủ điều kiện để phân tích nhân tố, nếu nhỏ hơn 0,5 thì phân tích nhân tố không thích hợp cho bộ số liệu này.Percentage of variance: phần trăm phương sai toàn bộ được giải thích bởi từng nhân tố. Nghĩa là nếu coi toàn bộ biến thiên là 100% thì giá trị này cho biết phân tích nhân tố cô đọng được bao nhiêu % và bị thất thoát bao nhiêu %76Các thực hiện:Xác định vấn đề: các biến số được đo bằng thang đo định lượng, cỡ mẫu phải lớn tối thiểu gấp 5 lần số biến số.Xây dựng ma trận hệ số tương quan: nếu hệ số tương quan giữa các biến số nhỏ thì phân tích nhân tố có thể không thích hợpSố lượng nhân tố: Có thể xác định trước (Priori determination) Dựa vào Evigenvalue: chỉ có nhân tố nào có evigenvalue lớn hơn 1 mới được giữ lại trong mô hình phân tích77Thực hiện bằng SPSS (tập số liệu Phan tich nhan to)Chọn Analyze Data Reduction Factor 78Các biến số trong phân tích nhân tốCác đại lượng thống kê mô tảLựa chọn ma trận hiệp phương sai và số lượng nhân tố Lựa chọn phép quayThường để mặc định7980Lựa chọn này cho phép số nhân tố được chọn dựa vào các biến có Eigenvalue over 1Lựa chọn số lượng nhân tố8182Kết quả:8384Có KMO = 0,584 > 0,5 và < 1Cho nên phân tích nhân tố thực hiện được858687Nhân tố 1 bao gồm: làm trắng răng, làm hơi thở thơm tho, làm răng bóng hơnNhân tố 2 bao gồm: ngừa sâu răng, làm khoẻ nướu răng, làm sạch cao răng8889Trong file dữ liệu lúc này cũng xuất hiện 2 biến mới tương ứng với 2 nhân tố chínhNhân tố 1 : FAC1_1Nhân tố 1 : FAC2_1Sau khi rút trích các nhân tố và lưu lại thành các biến mới này thay cho tập hợp biến gốc để đưa vào các phân tích tiếp theo như kiểm định trung bình, ANOVA, tương quan và hồi quy.90
Các file đính kèm theo tài liệu này:
- phan_tich_du_lieu_voi_spss_moi__4333.pptx