Bài giảng khai phá quan điểm và khai phá phương tiện xã hội - Chương 2: Bài toán khai phá quan điểm (phân tích tình cảm)

Ví dụ liên quan (Ví dụ 2.1)

Người đưa: John Smith Ngày: 10 tháng chín năm 2011

"(1) Tôi mua một máy ảnh Canon G12 sáu tháng trước đây. (2) Tôi đơn giản chỉ là thích nó. (3) Chất lượng hình ảnh là tuyệt vời. (4) Tuổi thọ pin cũng dài. (5) Tuy nhiên, vợ tôi nghĩ rằng nó là quá nặng cho cô ấy. “

Phân tích ví dụ

+ Đánh giá này có một số quan điểm tích cực (Câu 2, 3, 4) và tiêu cực (câu 5)

Nhận diện: Mỗi quan điểm có hai thành phần chính “(g, s): g là đối tượng và s là quan điểm tích cực tiêu chức”

Khai phá quan điểm ở đây có dạng (g, s): g là thực thể/khía cạnh, s là đánh giá tích cực, tiêu cực, trung tính: định hướng phân cực (sentiment/opinion) orientations/polarities).

+ Đánh giá này có hai tác giả

+ Đánh giá này xẩy ra ngày 10/9/2011

 

ppt10 trang | Chia sẻ: Mr Hưng | Lượt xem: 897 | Lượt tải: 0download
Nội dung tài liệu Bài giảng khai phá quan điểm và khai phá phương tiện xã hội - Chương 2: Bài toán khai phá quan điểm (phân tích tình cảm), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG KHAI PHÁ QUAN ĐIỂM VÀ KHAI PHÁ PHƯƠNG TIỆN XÃ HỘI CHƯƠNG 2. BÀI TOÁN KHAI PHÁ QUAN ĐIỂM (PHÂN TÍCH TÌNH CẢM)PGS. TS. HÀ QUANG THỤYHÀ NỘI 09-2013TRƯỜNG ĐẠI HỌC CÔNG NGHỆĐẠI HỌC QUỐC GIA HÀ NỘI*Nội dungĐịnh nghĩa bài toánTóm tắt quan điểmCác kiểu khai phá quan điểmChủ quan và cảm xúc*1. Định nghĩa bài toán đánh giá QĐVí dụ liên quan (Ví dụ 2.1)Người đưa: John Smith Ngày: 10 tháng chín năm 2011"(1) Tôi mua một máy ảnh Canon G12 sáu tháng trước đây. (2) Tôi đơn giản chỉ là thích nó. (3) Chất lượng hình ảnh là tuyệt vời. (4) Tuổi thọ pin cũng dài. (5) Tuy nhiên, vợ tôi nghĩ rằng nó là quá nặng cho cô ấy. “Phân tích ví dụ+ Đánh giá này có một số quan điểm tích cực (Câu 2, 3, 4) và tiêu cực (câu 5)Nhận diện: Mỗi quan điểm có hai thành phần chính “(g, s): g là đối tượng và s là quan điểm tích cực tiêu chức”Khai phá quan điểm ở đây có dạng (g, s): g là thực thể/khía cạnh, s là đánh giá tích cực, tiêu cực, trung tính: định hướng phân cực (sentiment/opinion) orientations/polarities).+ Đánh giá này có hai tác giả+ Đánh giá này xẩy ra ngày 10/9/2011*Định nghĩa quan điểmĐịnh nghĩa quan điểm sơ bộQuan điểm: (g, s, h, t) g: đối tượng quan điểm (hoặc tình cảm): opinion target, s : đánh giá về đối tượng: sentiment, h: người chủ quan điểm: opinion holder t : thời gian bày tỏ quan điểmVí dụ: (Canon G12, thích, Smith, 10/9/2011) (Hình ảnh Canon G12, tuyệt vời, Smith, 10/9/2011)Định nghĩa thực thểThực thể: sản phẩm, dịch vụ, chủ đề, vấn đề, người, tổ chức, hoặc sự kiện. Mô tả bằng cặp e: (T, W), với T là một hệ phân cấp của các thành phần, thành phần con v.v., và W là một tập các thuộc tính của e.Phân biệt khía cạnh – thành phần: trọng lượng: đặc trưng, pin: thành phần (tháo lắp được)*Định nghĩa quan điểm khái quátĐịnh nghĩa quan điểm khái quátMột quan điểm p = (ei, aij, sijkl, hk, tl), ei : tên một thực thể,aij : một khía cạnh của ei, sijkl : quan điểm trên khía cạnh aij của thực thể ei,hk : người chủ quan điểm, tl : thời gian khi quan điểm được hk bày tỏ. sijkl tình cảm tích cực, tiêu cực hoặc trung tính, hoặc thể hiện với mức độ sức mạnh / cường độ khác nhau (1-5)Nhận xét định nghĩaquan điểm sijkl phải được người chủ quan điểm hk đưa ra về khía cạnh aij của thực thể ei vào thời điểm tl. Năm thành phần là rất cần thiết, thiếu bất kỳ thành phần nào sẽ là vấn đề*Thể hiện khía cạnh và quan điểmThể hiện khía cạnh hiện/ẩnThể hiện hiện được biểu diễn bằng danh từ/cụm danh từ. “Ảnh chụp của Canon rất tươi”Thể hiện ẩn: không có danh từ/cụm danh từ biểu diễn. “Canon nặng”. Khía cạnh “trọng lượng” ẩn. “Máy ảnh này đắt”Thể hiện tình cảmTình cảm/đánh giá sijkl thường là từ/cụm từ. Phổ biến hiện: có từ tình cảm xuất hiệnCó thể có thêm trọng số: (1-5), hoặc như SentiWordNet.*MH thực thể và MH tài liệu quan điểmMô hình thực thểBiểu diễn ei một cách toàn bộ và một tập hữu hạn khía cạnh Ai = {ai1, ai2,..., ain}. ei được biểu diễn với bất kỳ một tập hữu hạn các thể hiện thực thể của nó {eei1, eei2,..., eeis}. Mỗi khía cạnh aij. của thực thể ei được thể hiện với bất kỳ một tập hợp hữu hạn của các biểu diễn khía cạnh {aeij1, aeij2,..., aeijm}Mô hình tài liệu quan điểmTài liệu d chứa quan điểm trên một tập thực thể {e1, e2,..., er} và một tập con các khía cạnh của chúng từ một tập các chủ sở hữu quan điểm {h1, h2,..., hp} vào một thời điểm cụ thể*Bài toán trong phân tích quan điểmTrích xuất và phân lớp thực thểInput: Tài liệu quan điểm dOutput: tập thực thể {e1, e2,..., er} xuất hiện trong dTrích xuất và phân lớp khía cạnhInput: Thực thể e trong tài liệu dOutput: Các nhóm cụm từ thể hiện các khía cạnh của eTrích xuất và phân lớp chủ của tình cảmInput: tập thực thể {e1, e2,..., er} xuất hiện trong dOutput: Người nêu một quan điểm về một thực thể eTrích xuất và chuẩn hóa thời gianInput: Một quan điểm trong tài liệu dOutput: Thời gian phát biểu quan điểmPhân lớp khía cạnh quan điểmInput: Cho một khía cạnh a và một nhận xétOutput: Nhận xét là tích cực/tiêu cựcSinh bộ 5 quan điểmInput: Tài liệu quan điểm dOutput: Mọi bộ năm quan điểm trong d*Ví dụNhận xét bigJohn ngày: 15 Tháng Chín, 2011 (1) Tôi mua một máy ảnh Samsung và bạn của tôi mua một máy ảnh Canon hôm qua. (2) Tuần qua, hai chúng tôi sử dụng máy ảnh rất nhiều. (3) Hình ảnh từ Samy của tôi là không tuyệt vời, và tuổi thọ pin ngắn. (4) Bạn của tôi hài lòng với máy ảnh của mình và rất hài lòng về chất lượng hình ảnh của nó. (5) Tôi muốn có một máy ảnh có thể chụp ảnh tốt. (6) Tôi sẽ có nó vào ngày mai. Chỉ có câu 3,4 là câu quan điểmKết quả(Samsung, chất_lượng_ảnh, tiêu cực, bigJohn, Sept-15-2011)(Samsung, tuổi_thọ_pin, tiêu cực, bigJohn, Sept-15-2011)(Canon, GENERAL, tích cực, Bạn-bigJohn, Sept-15-2011)(Canon, chất_lượng_ảnh, tích cực, Bạn-bigJohn, Sept-15-2011)*Tổng hợp quan điểmQuan điểm cần được tổng hợpMột người không cho ý kiến quyết địnhTập hợp quan điểm nhiều ngườiPhân tích quan điểm ~ Tóm tắt đa văn bảnVí dụMáy ảnh số 1:Khía cạnh: CHUNGTích cực: 105 Phủ định: 12 Khía cạnh: Chất lượng hình ảnhTích cực: 95 Phủ định: 10 Khía cạnh: Tuổi thọ pinTích cực: 50 Phủ định: 9 ”*

Các file đính kèm theo tài liệu này:

  • pptom_c2_994.ppt