Xử lý dữ liệu với spss

Là loại thang đo mà trong đó số đo dùng để xếp loại

 Dùng cho dữ liệu định tính

 Có thể gán các ký tự,trị số để mã hóa dữ liệu

 Các con số không có ý nghĩa về lượng

pdf97 trang | Chia sẻ: Mr Hưng | Lượt xem: 888 | Lượt tải: 1download
Bạn đang xem trước 20 trang nội dung tài liệu Xử lý dữ liệu với spss, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
67.96% 74.69% McFadden R-squared 38.64% 17.51% Likelihood ratio 33.98% 37.35% Nhận xét chung  Cả hai mô hình đều có độ phù hợp tổng quát với mức ý nghĩa quan sát (Sig. OB = 0.00 < α).  Độ chính xác của kết quả dự báo của hai mô hình rất cao lần lượt là: 94.40%, 90.60%.  Giá trị “McFadden R-squared” từ ước lượng hồi quy Binary Logistic của hai mô hình lần lượt là: 38.64%, 17.51% sự biến động của xác suất trả được nợ của khách hàng.  Về kiểm định -2LL không cao lắm, điều này thể hiện một độ phù hợp khá tốt của mô hình tổng thể. 5. Đề xuất mô hình xếp hạng tín dụng cá nhân cho Ngân hàng TMCP Sài Gòn  Mô hình 2 đảm bảo tất cả các hệ số hồi quy tìm được trong mô hình đều có ý nghĩa. Trong mô hình cũng không có hiện tượng đa cộng tuyến giữa biến thunhap và tietkiem (đã loại này ra khỏi mô hình 1 do biến tietkiem không có ý nghĩa thống kê vì có số Sig lớn 0.744).  Ta có thể nhận thấy về chỉ tiêu thống kê về mức độ phù hợp mô hình, mức độ chính xác của dự báo thì mô hình 2 là vượt trội nhất, thích hợp cho mô hình XHTD. Vì vậy, tác giả xin đề xuất mô hình 2 là mô hình XHTD cá nhân cho Ngân hàng TMCP Sài Gòn. Tiến hành phân tích và nhận xét mô hình 2: Độ phù hợp mô hình 2:  Kết quả kiểm định giả thuyết về độ phù hợp tổng quát ở Bảng 2.15 có mức ý nghĩa quan sát (Sig. OB = 0.00 < α) nên an toàn ta có thể bác bỏ giả thuyết: H0: β2 = β2 = β4 = β5 = β7 = β10 = β11 = β12 = β13 = β14 = β15 = 0 Bảng 2.15: Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 82.629 9 0.000 Block 82.629 9 0.000 Model 82.629 9 0.000 Bảng 2.16 cho thấy giá trị của – 2LL = 74.668 không cao lắm, như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể. Bảng 2.16: Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 1 74.688a 0.403 0.644 a. Estimation terminated at iteration number 9 because parameter estimates changed by less than .001. Mức độ chính xác của dự báo Mức độ chính xác của dự báo được thể hiện qua bảng Classification Table (Bảng 2.17) Bảng này cho thấy trong 26 trường hợp thực tế là không trả được nợ mô hình đã dự đoán trúng 21 trường hợp, tỷ lệ trúng là 67.7%. Còn 134 trường hợp thưc tế có trả được nợ mô hình dự đoán sai 10 trường hợp, tỷ lệ trúng là 96.1%. Từ đó ta tính được tỷ lệ dự đoán đúng toàn bộ mô hình là 90.6% Bảng 2.17: Classification Tablea Observed Predicted Khả năng trả nợ Percentage CorrectKhông có khả năng trả nợ Có khả năng trả nợ Step 1 Khả năng trả nợ Không có khả năng trả nợ 21 10 67.7 Có khả năng trả nợ 5 124 96.1 Overall Percentage 90.6 a. The cut value is .500 Kiểm định ý nghĩa của các hệ số hồi quy tổng thể Bảng 2.18: Variables in the Equation B S.E. Wald df Sig. Step 1a Gioitinh .704 .750 .880 1 .348 Tuoi .084 .048 3.084 1 .079 TĐHV -1.277 .751 2.890 1 .089 TCCV -1.993 .745 7.149 1 .008 Honnhan 2.683 1.189 5.095 1 .024 TTNO -.260 .786 .110 1 .740 Thoigianlamviec -.023 .013 3.407 1 .065 Songuoiphuthuoc -.690 .455 2.302 1 .129 LichsuTD -.483 .762 .402 1 .526 Sodichvu 1.449 .610 5.641 1 .018 Thunhap .672 .343 3.834 1 .050 Tietkiem -.141 .431 .106 1 .744 Tienvay -.014 .003 17.191 1 .000 Taisan .004 .001 9.589 1 .002 TLNTTS 10.727 3.540 9.181 1 .002 Kiểm định Wald về ý nghĩa cũa hệ số hồi quy tổng thể của các biến tuổi, tính chất công việc, hôn nhân, thời gian làm việc, số dịch vụ, thu nhập, tiền vay, tài sản, tỷ lệ dư nợ vay trên tổng giá trị tài sản đều có mức ý nghĩa sig. nhỏ hơn 0.05 nên ta an toàn bác bỏ giả thuyết H0: β2 = β2 = β4 = β5 = β7 = β10 = β11 = β12 = β13 = β14 = β15 = 0 Như vậy, các hệ số hồi quy tìm được có ý nghĩa và mô hình đưa ra sử dụng tốt. Từ các hệ số hồi quy này ta viết được phương trình Log e [ 𝑃 ( 𝑌 = 1) 𝑃 ( 𝑌=0 ) ] = - 8.793 + 0.097 tuoi – 1.259 TCCV + 1.259 honnhan – 0.020 thoigianlamviec + 1.138 sodichvu + 0.585 thunhap – 0.013 tienvay + 0.003 taisan + 8.193 TLNTTS. (1.1) Có thể diễn dịch ý nghĩa của các hệ số hồi quy Binary Logistic là: Hệ số hồi quy Tuổi (Tuoi): khi hệ số Tuổi làm tăng khả năng trả nợ của khách hàng. Điều này có thể lý giải trong thực tế là các ngân hàng e ngại cho những khách hàng trẻ vay sợ rủi ro, cho các khách hàng lớn tuổi vay ít rủi ro hơn. Tính chất công việc (TCCV): khi hệ số tính chất công việc càng lớn (khách hàng không có khả năng trả nợ càng cao. Trên thực tế, biến tính chất công việc tác giả phân loại thành 4 nhóm: Cấp quản lý; cấp chuyên viên hay kinh doanh có đăng ký; lao động được đào tạo, công nhân, kinh doanh tự do; lao động thời vụ, thất nghiệp, nghỉ hưu. Điều này cho thấy rằng những khách hàng càng có địa vị, chức vụ hay những khách hàng kinh doanh có đăng ký thì thường có một công việc cũng như mức thu nhập ổn định và có khả năng trả nợ cao hơn hai nhóm tính chất công việc còn lại.  Tình trạng hôn nhân (Honnhan): kết quả kiểm định mô hình cho thấy các khách hàng đã lập gia đình có ít rủi ro và có nhiều uy tín tín dụng, vì họ có trách nhiệm hơn người độc thân. Một yếu tố khác có thể làm cho những người đã lập gia đình có nhiều uy tín tín dụng hơn là thu nhập gấp đôi.  Thời gian làm công việc hiện tại (Thoigianlamviec): hệ số thời gian làm việc càng cao càng có khả năng trả nợ. Khi có thâm niên công việc hiện tại, thì thường có thu nhập cao hơn.  Số dịch vụ đang sử dụng (Sodichvu): khách hàng càng sử dụng nhiều dịch vụ của ngân hàng chứng tỏ khách hàng có mối quan hệ thân thiết và uy tín với ngân hàng.  Thu nhập hàng tháng (Thunhap): hệ số thu nhập càng cao khả năng trả nợ càng cao và tăng theo tỷ lệ tương ứng với mức thu nhập. Thu nhập thường được sử dụng đại diện cho sự giàu có về tài chính và khả năng trả nợ của người vay (Đinh & Kleimeier, 2007).  Số tiền vay (Tienvay): khi khoản vay càng tăng, khả năng trả nợ của khách sẽ giảm.  Giá trị tài sản (Taisan): tài sản thế chấp là một hình thức đảm bảo cho khoản vay của khách hàng. Đặc biệt, đối với các khoản vay sử dụng tài sản thế chấp là nhà ở, xác suất không trả nợ là rất thấp vì do người đi vay không muốn mất nhà của họ và đồng thời tài sản thế chấp này cũng làm giảm rủi ro của ngân hàng. Giá trị tài sản thế chấp cũng có thể nói lên sự giàu có về tài chính của khách hàng vì nó có mối tương quan đáng kể với thu nhập của khách hàng vay (Đinh & Kleimeier, 2007).  Tỷ lệ nợ trên tổng tài sản (TLNTTS): kết quả kiểm định mô hình cho thấy tỷ lệ nợ trên tổng tài sản càng cao khả năng trả nợ càng cao (trái dấu với giả thuyết). Điều này có thể giải thích, giá trị tài sản thế chấp có thể nói lên sự giàu có về tài chính của khách hàng vì nó có mối tương quan đáng kể với thu nhập của khách hàng vay (Đinh & Kleimeier, 2007) nên những khách hàng có giá trị tài sản thế chấp và mức thu nhập càng cao thì nhu cầu chi tiêu tiêu dùng trong đời sống xã hội càng cao nên họ thường vay ngân hàng với số tiền vay lớn cho các mục đích tiêu dùng khác nhau (sửa chữa, mua nhà, mua ôtô, bổ sung vốn kinh doanh.), làm cho tỷ lệ nợ trên tổng tài sản càng cao. Tổng giá trị tài sản càng cao thì người vay càng có trách nhiệm với khoản vay của mình và thiện chí trả nợ cũng sẽ cao hơn.  Ta có thể hoàn thiện hệ thống đánh giá xếp hạng tín dụng cá nhân dựa trên dự đoán xác suất được thực hiện thông qua hàm hồi quy Binary Logistic ước lượng từ mẫu trên.  Năm hạng mức tín nhiệm cũng được đưa ra A, A1, B, B1, C dựa trên 5 loại khách hàng mà ngân hàng TMCP Sài Gòn đang áp dụng, tương ứng với xác suất trả nợ theo bảng sau: Bảng 2.19: Tiêu chuẩn phân bổ cá thể theo mức rủi ro Loại hiện tại Xếp hạng tín nhiệm Xác suất trả nợ (%) Mức độ rủi ro 1 A 91 – 100 Rất thấp 2 A1 90 – 75 Thấp 3 B 74 – 65 Trung Bình 4 B1 64 – 35 Cao 5 C 34 – 0 Rất cao Ví dụ: Chấm điểm xếp hạng tín dụng cá nhân Khách hàng Nguyễn Văn A (Kết quả xếp hạng A1, điểm tín dụng 315 điểm) Vận dụng mô hình Binary Logistic cho mục đích dự báo Bảng 2.20: Thông tin xếp hạng khách hàng Nguyễn Văn A Chỉ tiêu Thông tin Hệ số Hằng số Tuổi 42 0.097 -8.739 Tính chất công việc 2 -1.259 Hôn nhân 1 1.909 Thời gian làm việc 125 -0.02 Số dịch vụ 1 1.138 Thu nhập 11 0.585 Tiền vay 173 -0.013 Tài sản 709 0.003 Tỷ lệ nợ trên tổng tài sản 0.2434 8.193  Xác suất trả nợ của khách hàng Nguyễn Văn A là: E(Y/X)= 𝑒−8.739+0.097∗42−1.259∗2+1.909∗1−0.02∗125+1.138∗1+0.585∗11−0.013∗173+0.003∗709+8.193∗0.2434 1+𝑒−8.739+0.097∗42−1.259∗2+1.909∗1−0.02∗125+1.138∗1+0.585∗11−0.013∗173+0.003∗709+8.193∗0.2434 = 5.318 1+5.318 = 0.8417 Như vậy, mô hình Binary Logistic dự đoán khả năng trả nợ của khách hàng Nguyễn Văn A là 84.17%. Theo quy định trong bảng 2.18 thì xác suất trả nợ của khách hàng tương ứng với mức rủi ro A1 phù hợp với mức xếp hạng trong dữ liệu. Như vậy, khi ngân hàng cho khách hàng Nguyễn Văn A vay thì khả năng thu hồi nợ cao. Khách hàng Nguyễn Thị B (Kết quả xếp hạng B, điểm tín dụng 285 điểm)  Xác suất trả nợ của khách hàng Nguyễn Thị B là: E(Y/X) = 𝑒−8.739+0.097∗48−1.259∗3+1.909∗1−0.02∗128+1.138∗1+0.585∗8−0.013∗60+0.003∗130+8.193∗0.4604 1+𝑒−8.739+0.097∗48−1.259∗3+1.909∗1−0.02∗128+1.138∗1+0.585∗8−0.013∗60+0.003∗130+8.193∗0.4604 = 1.992 1+1.992 = 0.6658 Bảng 2.21: Thông tin xếp hạng khách hàng Nguyễn Thị B Chỉ tiêu Thông tin Hệ số Hằng số Tuổi 48 0.097 -8.739 Tính chất công việc 3 -1.259 Hôn nhân 1 1.909 Thời gian làm việc 128 -0.02 Số dịch vụ 1 1.138 Thu nhập 8 0.585 Tiền vay 60 -0.013 Tài sản 130 0.003 Tỷ lệ nợ trên tổng tài sản 0.4604 8.193 Như vậy, mô hình Binary Logistic dự đoán khả năng trả nợ của khách hàng Nguyễn Văn A là 66.58%. Theo quy định trong bảng 2.18 thì xác suất trả nợ của khách hàng tương ứng với mức rủi ro B phù hợp với mức xếp hạng trong dữ liệu. Như vậy, khi ngân hàng cho khách hàng Nguyễn Văn A vay thì khả năng thu hồi nợ cao. THANKS

Các file đính kèm theo tài liệu này:

  • pdfho_thanh_tri_xu_ly_du_lieu_hoi_quy_169.pdf