Hiện nay, khai thác quan điểm của khách hàng thông qua các bình luận, phản hồi đang được ứng dụng ngày càng nhiều trong các hệ thống gợi ý, đặc biệt là các trang web thương mại điện tử. Phần lớn các hệ thống hiện tại chỉ đưa ra gợi ý dựa trên ước đoán điểm đánh giá tổng thể của sản phẩm mà chưa chú trọng đến điểm từng tính năng của sản phẩm. Hướng tiếp cận này có thể sẽ gợi ý các sản phẩm chưa đúng với nhu cầu của khách hàng trong trường hợp họ quan tâm tới chi tiết tính năng của sản phẩm. Để giải quyết vấn đề nêu trên, trong bài báo này, chúng tôi đề xuất giải pháp gợi ý sản phẩm dựa trên tính năng. Hệ thống sẽ thu thập ý kiến/bình luận của khách hàng về các nhóm sản phẩm cần gợi ý, sử dụng các kỹ thuật của lĩnh vực khai phá quan điểm để xác định được quan điểm của khách hàng. Mỗi bình luận của khách hàng sẽ được hệ thống xử lý để thu được các thông tin: tên sản phẩm, tính năng, quan điểm (xấu, bình thường, tốt) phục vụ xây dựng CSDL cho bước gợi ý. Kết quả thực nghiệm trên nhóm sản phẩm điện thoại di động với hơn 10000 bình luận tiếng Việt đã khẳng định tính khả thi của giải pháp mà chúng tôi đề xuất
9 trang |
Chia sẻ: Thục Anh | Lượt xem: 670 | Lượt tải: 0
Nội dung tài liệu Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
đa nghĩa và các từ mang nghĩa “bóng”. Bảng 3 trình bày một số câu bình luận có chứa từ mà hệ thống chúng tôi đề
xuất hiện tại chưa xử lý được.
Bảng 3. Một số bình luận hệ thống không thể xử lý
Tên sản phẩm Bình luận Điểm đánh giá
(số )
Lý do
Asus_Zenfone 4 Max_Pro
(No.00393814)
camera 16 m nhưng chỉ
tiếc màn hình hd nên hình
ảnh cũng k đc đẹp cho lắm
5 Kí tự „k‟ có thể diễn tả cho
1000 trong tiếng Việt không
chính thống, cũng có thể là từ
viết tắt cho chữ “không”,
“khó”.
Chuỗi “đc” có thể là từ viết tắt
cho chữ “được” hoặc “địa chỉ”.
Asus_Zenfone 4 Max_Pro
(No.00393814)
ok đáng đồng tiền bát gạo 4 Hệ thống không nhận dạng
được ngữ “đáng đồng tiền bát
gạo”.
Vấn đề thứ hai cũng ảnh hưởng nhiều đến độ chính xác đó là yếu tố con người trong việc cho điểm đánh giá. Ở
đây chúng tôi muốn nói đến cách cho điểm đánh giá của các người dùng khác nhau là rất khác nhau. Ví dụ như câu
bình luận có ý nói sản phẩm chất lượng trung bình nhưng điểm đánh giá lại được 5 sao trong khi một số bình luận có
quan điểm tiêu cực nhưng cũng có điểm đánh giá là 4 sao. Bảng 4 minh họa cho một số trường hợp bình luận và điểm
đánh giá không tương ứng.
Bảng 4. Một số bình luận và điểm đánh giá không tương xứng
Sản phẩm Bình luận Đánh giá
Asus_Zenfone 4 Max_Pro (No.00393814) Máy sử dụng ổn 3
Asus_Zenfone 4 Max (No.00415196) Chụp hình ổn 5
Asus_Zenfone 4 Max_Pro (No.00393814) Máy hơi dày và nặng 4
Nokia 3310 (No.00349644) Tuy nhiên đồ làm bằng nhựa bóng nên cầm hơi trơn
tay.
4
V. KẾT LUẬN
Trong bài báo này chúng tôi đã đề xuất giải pháp xây dựng hệ thống gợi ý sản phẩm theo tính năng dựa trên
việc thu thập và phân tích quan điểm của khách hàng về nhóm sản phẩm tương ứng. Giải pháp mà chúng tôi xây dựng
có đồng thời 2 ưu điểm so với những hệ thống gợi ý khác: 1- Sản phẩm được gợi ý theo tính năng nên sẽ phù hợp hơn
với yêu cầu của người dùng. Đặc biệt là đối với các nhóm sản phẩm/dịch vụ có nhiều tính năng, khía cạnh khác nhau.
Sản phẩm được gợi ý sẽ có tính năng người dùng mong muốn tìm kiếm là tốt nhất dựa trên quan điểm của những khách
hàng đã sử dụng sản phẩm/dịch vụ đó. 2- Hệ thống thể hiện được xu hướng tiêu dùng của khách hàng theo thời gian.
Hệ thống đề xuất đã được thực nghiệm trên tập dữ liệu bao gồm gần 15.000 bình luận về các sản phẩm điện
thoại thông minh trong đó 1/3 được dùng làm tập dữ liệu huấn luyện và 2/3 dùng làm tập dữ liệu kiểm thử. Hai kịch
bản thực nghiệm được đề xuất và cho kết quả khả quan, đặc biệt là đối với các bình luận bằng ngôn ngữ tiếng Việt,
ngôn ngữ chưa có các công cụ phân tích văn phạm chuẩn xác.
Chúng tôi cũng phân tích và đánh giá những vấn đề còn tồn tại mà hệ thống chưa giải quyết được đó là yếu tố
con người trong việc sử dụng từ ngữ cũng như trong việc đưa ra điểm đánh giá. Bên cạnh đó chúng tôi cũng nghĩ rằng
quan điểm của người dùng trong bình luận sẽ được phán đoán chính xác hơn nếu như các từ cảm xúc không được xử lý
một cách riêng lẻ mà kết hợp với tính năng của sản phẩm. Ví dụ thuật ngữ “pin trâu” nếu được xử lý cùng nhau sẽ có
được quan điểm rất tích cực cho tính năng dung lượng pin của điện thoại, trong khi xử lý riêng lẻ thì thuật ngữ này sẽ
bị bỏ qua. Đây cũng là hướng nghiên cứu mà chúng tôi nhắm đến trong các nghiên cứu tiếp theo.
VI. TÀI LIỆU THAM KHẢO
[1] Hu R, Pu P. Potential acceptance issues of personality-ASED recommender systems. In: Proceedings of ACM
conference on recommender systems (RecSys‟09), New York City, NY, USA; October 2009. p. 22–5.
198 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG
[2] Pu P, Chen L, Hu R. A user-centric evaluation framework for recommender systems. In: Proceedings of the fifth
ACM conference on Recommender Systems (RecSys‟11), ACM, New York, NY, USA; 2011. p. 57–164.
[3] Pilaszy I., & Tikk D. (2009). Recommending new movies: Even a few ratings are more valuable than metadata. In
Proceedings of the Third ACM Conference on Recommender Systems (RecSys 2009), (p. 93-100). NY, ACM.
[4] Wei R., Xu H. A Formal Cost-Effectiveness Analysis Model for Product Evaluation in E-Commerce. In: SEKE, p.
287–293, 2013.
[5] Esuli A, Sebastiani F. Sentiwordnet: A Publicly Available Lexical Resource for Opinion Mining. In: Proceedings
of the 5th Conference on Language Resources and Evaluation, p. 417-412, 2006.
[6] Baccianella S., A. Esuli, and F. Sebastiani. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment
Analysis and Opinion Mining. In: Proceedings of the International Conference on Language Resources and
Evaluation, p.17-23, 2010.
[7] Nguyen H. N., et al. Domain Specific Sentiment Dictionary for Opinion Mining of Vietnamese Text. In:
Proceedings of the 8th International Workshop on Multidisciplinary Trends in Artificial Intelligence, p.136-148.
[8] Nitin Jindal and Bing Liu. 2006. Identifying comparative sentences in text documents. In Proceedings of the 29th
annual international ACM SIGIR conference on Research and development in information retrieval (SIGIR '06).
ACM, New York, NY, USA, 244-251.
[9] Yue Lu, ChengXiang Zhai, and Neel Sundaresan. Rated aspect summarization of short comments. In: Proceedings
of the 18th international conference on World wide web, pp. 131–140, 2009.
[10] Samuel Brody and Noemie Elhadad. An unsupervised aspect-sentiment model for online reviews. In: Proceeding
HLT ‟10 Human Language Technologies: The 2010 Annual Conference of the North American, Chapter of the
Association for Computational Linguistics, pp. 804–812, 2010.
[11] C. Sauper, Aria Haghighi, and Regina Barzilay. Content Models with Attitude. In: Proceeding HLT ‟11
Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language
Technologies - Volume 1, pp. 350–358.
[12] Christina Sauper and Regina Barzilay. Automatic Aggregation by Joint Modeling of Aspects and Values. Journal
of Artificial Intelligence Research, Volume 46, pp. 89-127, 2013.
[13] Himabindu Lakkaraju, Chiranjib Bhattacharyya, Srujana Merugu, and Indrajit Bhattacharya. Exploiting
Coherence for the Simultaneous Discovery of Latent Facets and associated Sentiments. In: Proceedings of the
Eleventh SIAM International Conference on Data Mining, SDM 2011, p. 498–509.
[14] Angeliki Lazaridou, Ivan Titov, and Caroline Sporleder. A Bayesian Model for Joint Unsupervised Induction of
Sentiment, Aspect and Discourse Representations. In: Proceedings of the 51st Annual Meeting of the Association
for Computational Linguistics, ACL 2013, p. pages 1630–1639.
[15] M. Baumgarten, M. D. Mulvenna, N. Rooney, and J. Reid. 2013. Keyword-Based Sentiment Mining using
Twitter. Int. J. Ambient Comput. Intell. 5, 2 (April 2013), 56-69.
[16] Lucie Flekov, Oliver Ferschk and Iryna Gurevych. UKPDIPF: A Lexical Semantic Approach to Sentiment
Polarity Prediction in Twitter Data. In: Proceedings of the 8th International Workshop on Semantic Evaluation
(SemEval 2014), Dublin, Ireland, pp. 704-710, 23-24 August (2014).
[17] W. Y. Wang and D. Yang. 2015. That‟s so annoying!!!: A lexical and frame-semantic embedding based data
augmentation approach to automatic categorization of annoying behaviors using #petpeeve tweets. In Empirical
Methods in Natural Language Processing (EMNLP).
[18] Le B., Nguyen H. (2015) Twitter Sentiment Analysis Using Machine Learning Techniques. In: Le Thi H.,
Nguyen N., Do T. (eds) Advanced Computational Methods for Knowledge Engineering. Advances in Intelligent
Systems and Computing, vol 358. Springer, Cham.
[19] Aliaksei Severyn and Alessandro Moschitti. 2015. Twitter Sentiment Analysis with Deep Convolutional Neural
Networks. In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in
Information Retrieval (SIGIR '15). ACM, New York, NY, USA, 959-962.
[20] A. C. Pandey, D. S. Rajpoot, M. Saraswat. Twitter sentiment analysis using hybrid cuckoo search method.
Information Processing & Management, vol. 53, no. 4, pp. 764-779, 2017.
[21] F. Balage, P. Pedro and T. A. S. Pardo. NILC-USP: A Hybrid System for Sentiment Analysis in Twitter
Messages. In: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013),
Georgia, 2013, pp. 568-572.
[22] T. L. Griffiths and M. Steyvers. Finding scientific topics. Proceedings of the National Academy of Sciences of the
United States of America, 101(Suppl 1):5228--5235, 2004.
[23] P. Le-Hong. An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts.
In: Proceedings of Traitement Automatique des Langues Naturelles (TALN-2010), Montreal, Canada, 2010.
Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 199
[24] Konstantin Bauman, Bing Liu, and Alexander Tuzhilin. 2017. Aspect Based Recommendations: Recommending
Items with the Most Valuable Aspects Based on User Reviews. In Proceedings of the 23rd ACM SIGKDD
International Conference on Knowledge Discovery and Data Mining (KDD '17). ACM, New York, NY, USA,
717-725. DOI: https://doi.org/10.1145/3097983.3098170.
PRODUCT RECOMMENDATION SYSTEM BASED ON CUSTOMER REVIEWS
ANALYSIS
Tran Thi Thuy, Truong Quoc Dinh, Nguyen Van Tho, Huynh Trung Long
ABSTRACT: Nowadays, many e-commerce websites implement recommendation function which is based on customer
reviews/feedbacks analysis. The majority of these systems make the suggestions by using only the overall product ratings. By using
this approach, systems may suggest products that are not relevant to the customer needs, especially in the case that they take into
account only several product features. To deal with this problem, in this paper, we propose construct a feature-based
recommendation system. The proposed system will collect customer reviews/feedbacks concerning given product and then uses
natural language processing techniques to discover customer opinion. Experimental results conducted on 10.000 Vietnamese
smartphone reviews show the feasibility of proposed system.
Các file đính kèm theo tài liệu này:
- goi_y_san_pham_dua_tren_uoc_doan_quan_diem_khach_hang.pdf