Phương pháp xây dựng hệ thống gợi ý sản phẩm sử dụng phản hồi tiềm ẩn

Hệ thống gợi ý (Recommender Systems) đã và đang được ứng dụng trong rất nhiều lĩnh vực như giải trí, giáo dục,

khoa học, và đặc biệt là thương mại điện tử. Việc tích hợp kỹ thuật gợi ý vào các hệ thống trực tuyến nhằm tự động phân tích các

hành vi trong quá khứ của người dùng để dự đoán nhu cầu/sở thích của họ trong tương lai, từ đó có những đề xuất hợp lý cho người

dùng là rất cần thiết trong thực tế.

Bài viết này đề xuất một giải pháp xây dựng hệ thống gợi ý dành cho bán hàng trực tuyến sử dụng phản hồi tiềm ẩn (implicit

feedbacks) từ người dùng. Trước hết chúng tôi đề xuất phương pháp thu thập thông tin phản hồi tiềm ẩn, sau đó tìm hiểu các

phương pháp gợi ý phù hợp từ đó đề xuất sử dụng phương pháp tập hợp mô hình để kết hợp các mô hình dự đoán nhằm tăng độ

chính xác. Kế đến là việc cài đặt, điều chỉnh, kiểm thử và và tích hợp các mô hình đã đề xuất vào hệ thống nhằm gợi ý các sản phẩm

phù hợp với sở thích của người dùng. Sau cùng, chúng tôi thu thập phản hồi từ người dùng thực nhằm đánh giá hiệu quả của

phương pháp đã đề xuất. Kết quả cho thấy mô hình đề xuất có khả năng gợi ý tốt cho người dùng và hoàn toàn có thể tích hợp vào

các hệ thống bán hàng trực tuyến.

12 trang | Chia sẻ: phuongt97 | Lượt xem: 889 | Lượt tải: 0

Nội dung tài liệu Phương pháp xây dựng hệ thống gợi ý sản phẩm sử dụng phản hồi tiềm ẩn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

từ người dùng như minh họa trong hình 7. Huấn luyện lại mô hình gợi ý: Chúng tôi cũng xây dựng công cụ hỗ trợ admin huấn luyện lại toàn bộ mô hình gợi ý sau một thời gian sử dụng như minh họa trong Hình 8. Ngoài ra còn rất nhiều tính năng khác như quản lý khách hàng, giỏ hàng, thanh toán, tương tự như bất kỳ một hệ thống thương mại điện tử nào khác. Lưu Nguyễn Anh Thư, Nguyễn Thái Nghe Hình 5. Sơ Hình 6. Lược đồ use case của đồ cơ sở dữ liệ khách hàng u của hệ thống 607 6B p a T k 08 . Đánh giá Chúng hẩm và 637 đ . So sánh kế Kết quả hực nghiệm c ể (chỉ có 0.18 kết quả của c tôi thu thập th ánh giá (số lần t quả sử dụng kiểm tra dùn ho thấy rõ ràn 78 trong khi c Stt l Tru PHƯ ác mô hình d ông tin phản mua lớn nhấ thông tin ph g độ đo MA g rằng khi sử hỉ sử dụng mộ B ần kiểm tra 1 2 3 4 5 6 7 8 9 10 ng bình ƠNG PHÁP XÂ ự đoán hồi từ người t là 4, số lần x ản hồi tiềm ẩn E cho các mô dụng kết hợp t thông tin ph ảng 1. So sánh uir1ˆ 0.43 0.43 0.43 0.42 0.43 0.43 0.43 0.43 0.43 0.44 0.40 Hình 7. Gợi Y DỰNG HỆ TH dùng thực, tậ em sản phẩm hình ở công cả 2 thông tin ản hồi độ lỗi l tỉ lệ lỗi MAE 06 0 99 0 73 0 84 0 49 0 86 0 17 0 17 0 65 0 70 0 87 0 ý sản phẩm ch ỐNG GỢI Ý SẢ p dữ liệu thu lớn nhất là 12 thức (13), (14 phản hồi từ ần lượt là 0.40 của các mô hìn uir2ˆ .3533 .3365 .3466 .3416 .3424 .3431 .3553 .3519 .3486 .3453 .3464 o khách hàng N PHẨM SỬ D được gồm 1 .25). ), (15) được người dùng, đ 87 và 0.3464) h uirˆ 0.1848 0.1922 0.1873 0.1917 0.1942 0.1883 0.1864 0.1837 0.1829 0.1869 0.1878 ỤNG PHẢN HỒ 86 người dùn trình bày tron ộ lỗi MAE giả I TIỀM ẨN g, 174 sản g Bảng 1. m đi đáng Lb p [ li h đ tr lỗ 1 ưu Nguyễn Anh . So sánh kết Kết quả hản hồi tiềm 2][7] như min Bên cạn ệu benchmark ttp://www.rec ược thu thập ên độ đo lỗi M i thấp hơn cá Thư, Nguyễn Th quả với các g so sánh trên ẩn, tỷ lệ lỗi cũ h họa trong H Hình 9. Độ lỗi h đó, chúng t cung cấp bở syswiki.com/w dữ liệu bán hà AE và RMS c phương pháp erflow.com/q ái Nghe Hìn iải thuật nền độ đo chuẩn M ng thấp hơn ình 9. MAE của các ôi cũng so sán i cộng đồng iki/Grocery_ ng trong thán E được trình b baseline khá Hình 10. Độ lỗ uestions/250 h 8. Giao diện (baseline) khá ean Absolut các phương p giải thuật dự đo h phương phá người dùng n shopping_dat g 12 năm 20 ày trong Hìn c. i MAE và RM 14904/downlo hỗ trợ huấn luy c e Error (MAE háp nền khác án trên tập dữ p sử dụng phả ghiên cứu về asets. Chúng 00, bao gồm 1 h 10. Kết quả SE của các giải ad-link-for-ta ện lại các mô h ) cho khi sử d như: Global A liệu thu thập từ n hồi tiềm ẩn hệ thống gợi tôi sử dụng tậ 5447 users, 1 này cũng cho thuật trên tập d -feng-grocery ình ụng phương verage, User người dùng thự với các phươ ý, các tập dữ p dữ liệu Ta- 780 items, và thấy sử dụng ữ liệu Ta-Feng -dataset pháp dành ch Average, Item c của hệ thống ng pháp khác liệu này có Feng1 có tên 178216 rating phản hồi tiềm 609 o thông tin Average trên tập dữ tại địa chỉ là D12, đã s. Kết quả ẩn cho độ 610 PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG GỢI Ý SẢN PHẨM SỬ DỤNG PHẢN HỒI TIỀM ẨN c. Đánh giá hiệu quả của hệ thống gợi ý sản phẩm cho người dùng Ngoài việc đánh giá độ chính xác của các dự đoán theo độ đo lỗi như trên, chúng tôi cũng đánh giá hiệu quả của việc gợi ý xem nó có phù hợp cho mỗi người dùng hay không. Gợi ý được xem là phù hợp khi người dùng có chọn sản phẩm từ danh sách những sản phẩm đã được gợi ý cho họ, dựa theo mô tả trong tài liệu [9]. Để thực hiện điều đó, chúng tôi tiến hành kiểm tra kết quả dự đoán Top-K sản phẩm cho người dùng trên tập dữ liệu thu được. Quá trình được thực hiện theo các bước: • Tạo tập dữ liệu train và test theo từng user. Với mỗi user chọn 70% dữ liệu cho train, 30% còn lại dùng để test. • Tiến hành huấn luyện mô hình trên tập dữ liệu train đã tạo. • Dự đoán cho từng user trên tất cả các item không có trong tập train. Lấy Top-K (K=15) sản phẩm có giá trị dự đoán cao nhất để kiểm tra, so sánh các giá trị này với tập dữ liệu test. Với mỗi lần gợi ý Top-K như thế, nếu các item này có trong tập test của user tương ứng, xem như lần gợi ý đó là phù hợp. • Lặp lại cho tất cả các user được chọn thử nghiệm. Do hệ thống mới chỉ cài đặt, lượng user thực chưa nhiều nên chúng tôi chọn ngẫu nhiên 5 user để thử nghiệm, dữ liệu minh họa trong Bảng 2 sau: Bảng 2. Thống kê số lượng đánh giá của các user dùng kiểm tra độ chính xác gợi ý hệ thống User Tổng số đánh giá Số đánh giá dùng để train Số đánh giá dùng để test User 21 43 32 11 User 22 34 24 10 User 46 11 8 3 User 48 7 5 2 User 56 6 4 2 Bảng 3. Thống kê số sản phẩm dự đoán của các user trong Top-15 có xuất hiện trong tập test qua các lần dự đoán STT lần test User 21 User 22 User 46 User 48 User 56 Số sp Mã sp Số sp Mã sp Số sp Mã sp Số sp Mã sp Số sp Mã sp 1 2 134, 164 1 38 1 130 0 0 2 2 134, 144 2 38, 70 1 130 1 33 0 3 3 134,144, 164 22 38 1 30 0 0 4 2 134,164 2 35, 38 1 130 0 0 5 1 164 0 1 130 0 0 6 1 164 1 38 1 130 0 0 7 2 134, 164 1 158 2 130, 105 1 33 0 8 1 134 0 1 130 1 33 0 9 2 134, 164 1 38 1 130 0 0 10 0 1 38 1 130 0 0 TB 90% 80% 100% 30% 0% Thử nghiệm trên 10 lần chạy, với mỗi lần lấy Top-15 sản phẩm dự đoán để kiểm tra trong tập test, kết quả trình bày như trong Bảng 3. Trong bảng này, mỗi cột là một người dùng, mỗi hàng là kết quả thống kê số lượng sản phẩm gợi ý trong Top-15 có xuất hiện trong tập test với các mã sản phẩm cụ thể qua một lần chạy kiểm tra của từng người dùng. Ví dụ: ở lần kiểm tra thứ nhất, các sản phẩm được gợi ý cho user 21 có xuất hiện trong tập test là 2 sản phẩm với mã sản phẩm cụ thể 134, 164. Như vậy, trong lần gợi ý này, user 21 nhận có sản phẩm phù hợp (chính xác) với sở thích của mình. Lặp lại tương tự cho các user khác. Từ kết quả này, chúng tôi thấy rằng độ chính xác của kết quả gợi ý qua mỗi lần kiểm tra khá cao đối với các người dùng là thành viên thường xuyên của hệ thống và số lượng đánh giá sản phẩm nhiều. Trong bảng thống kê này có 5 người dùng trong đó có 3 người dùng (user 21, user 22, user 46) là khách hàng thường xuyên đến hệ thống có đăng ký tài khoản và số lượng đánh số sản phẩm nhiều nên độ chính xác cao. Có 2 người dùng (user 48, user 56) là khách hàng vãng lai được ghi nhận bằng địa chỉ IP khi truy cập, họ chỉ đến hệ thống một lần do vậy chưa đủ thông tin để mô hình cho kết quả dự đoán tốt. VI. KẾT LUẬN Bài viết này đã đề xuất một giải pháp xây dựng hệ thống gợi ý sản phẩm trong bán hàng trực tuyến dựa trên phản hồi tiềm ẩn của người dùng. Trước hết chúng tôi đề xuất phương pháp thu thập thông tin phản hồi tiềm ẩn, sau đó Lưu Nguyễn Anh Thư, Nguyễn Thái Nghe 611 đề xuất phương pháp sử dụng các thông tin này, đồng thời cài đặt các mô hình, điều chỉnh và tích hợp vào hệ thống nhằm gợi ý các sản phẩm phù hợp với sở thích của người dùng. Để đánh giá phương pháp đã được đề xuất, chúng tôi đã xây dựng hệ thống và thu thập phản hồi từ người dùng thực. Kết quả thực nghiệm cho thấy giải pháp tích hợp các thông tin phản hồi tiềm ẩn cho độ lỗi thấp hơn chỉ sử dụng một thông tin đơn lẻ như trong các hệ thống gợi ý khác, đồng thời khả năng mà hệ thống gợi ý phù hợp với sở thích của từng đối tượng người dùng là khá tốt, vì vậy giải pháp được đề xuất hoàn toàn có thể ứng dụng cho các trang web bán hàng trực tuyến hiện nay. VII. TÀI LIỆU THAM KHẢO [1] Li Chen, Guanliang Chen, and Feng Wang. 2015. Recommender systems based on user reviews: the state of the art. User Modeling and User-Adapted Interaction 25, 2 (June 2015), 99-154. DOI=10.1007/s11257-015-9155-5 [2] Ricci, F., Rokach, L., Shapira, B. & Kantor, P.B., eds. (2011). Recommender Systems Handbook. Springer. [3] Yehuda Koren. 2008. Factorization meets the neighborhood: a multifaceted collaborative filtering model. In Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD '08). ACM, New York, NY, USA, 426-434. DOI=10.1145/1401890.1401944 [4] Y. Hu, Y. Koren, and C. Volinsky. Collaborative filtering for implicit feedback datasets. In IEEE International Conference on Data Mining (ICDM 2008), pages 263-272, 2008. [5] Koren, Y., Bell, R., Volinsky, C.: Matrix factorization techniques for recommender systems. IEEE Computer Society Press, 42(8), pp 30-37, 2009. [6] Nguyễn Hùng Dũng và Nguyễn Thái Nghe. 2014. Hệ thống gợi ý sản phẩm trong bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác. Tạp chí Khoa học Trường Đại học Cần Thơ, số 31a (2014), trang 36-51. ISSN: 1859-2333. [7] Nguyen Thai-Nghe. 2013. An introduction to factorization technique for building recommendation systems. Vol. 6/2013, pp. 44-53, Journal of Science - University of Da Lat, ISSN 0866-787X [8] Thai-Nghe, N., Drumond, L., Krohn-Grimberghe, A., and Schmidt-Thieme, L.(2010a). Recommender system for predicting student performance. In Proceedings of the 1st Workshop on Recommender Systems for Technology Enhanced Learning (RecSysTEL 2010), volume 1, pages 2811–2819. Elsevier’s Procedia CS. [9] Guy Shani and Asela Gunawardana. Evaluating Recommendation Systems. November 2009. [10] Rendle, S., Freudenthaler, C., Gantner, Z., Lars, S. T.: Bpr: Bayesian personalized ranking from implicit feedback. In: Proceedings of the 25th Conference on Uncertainty in Articial Intelligence, AUAI Press (2009). [11] Takacs, G., Pilaszy, I., Nemeth, B., & Tikk, D. (2009). Scalable collaborative filtering approaches for large recommender systems (special topic on mining and learning with graphs and relations). Journal of Machine Learning Research, 10, 623-656. [12] Thomas G. Dietterich, Ensemble Methods in Machine Learning. Lecture Notes in Computer Science Volume 1857, 2000, pp 1-15. Springer. [13] Su, X. & Khoshgoftaar, T. M. A survey of collaborative filtering techniques. Advances in Artificial Intelligence, (4) 1-19, 2009. [14] Zeno Gantner, Steffen Rendle, Christoph Freudenthaler, and Lars Schmidt-Thieme. 2011. MyMediaLite: a free recommender system library. In Proceedings of the fifth ACM conference on Recommender systems (RecSys '11). ACM, New York, NY, USA, 305-308. DOI=10.1145/2043932.2043989 A METHOD FOR BUILDING A PRODUCT RECOMMENDATION SYSTEM USING IMPLICIT FEEDBACKS Lưu Nguyễn Anh Thư, Nguyễn Thái Nghe Abstract: Recommender Systems are widely used in many areas such as entertainment, education, science, especially e-commerce. Integrating recommender system techniques to online shopping systems to recommend suitable products to users is really useful and necessary. In this work, we propose an approach for building an online shopping system with integrating recommender system technique, especially using implicit feedbacks from the users. For building the system, first we propose a method to collect the users’ implicit feedbacks. Then, we propose an ensemble method which combine several extended matrix factorization models which are specialized for those implicit feedbacks. Next, we analyze, design, and implement an online system to integrate the aforementioned recommendation techniques. After having the system, we collect the feedbacks from the real users to validate the proposed approach. Results show that this approach is feasible and can be applied for the real systems. Keywords: Recommender systems, product recommendation, implicit feedback, matrix factorization

Các file đính kèm theo tài liệu này:

phuong_phap_xay_dung_he_thong_goi_y_san_pham_su_dung_phan_ho.pdf