Luận án Nghiên cứu cải tiến một số phương pháp phân tích quan điểm mức khía cạnh dựa trên học máy
- Người chia sẻ : vtlong
- Số trang : 126 trang
- Lượt xem : 9
- Lượt tải : 500
Các file đính kèm theo tài liệu này
luan_an_nghien_cuu_cai_tien_mot_so_phuong_phap_phan_tich_qua.pdf
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu cải tiến một số phương pháp phân tích quan điểm mức khía cạnh dựa trên học máy, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Trong thời đại công nghệ thông tin phát triển hiện nay, lượng người dùng Internet
ngày càng tăng. Theo thống kê của We Are Social and Hootsuite, tính đến tháng 1
năm 2022 có 4,95 tỉ người dùng Internet, với tỉ lệ 62,5% dân số trên toàn cầu. Trong
đó, số người dùng mạng xã hội là 4,62 tỉ người dùng, bằng 58,4% tổng dân số thế
giới. Kết quả khảo sát cũng cho thấy rằng đến hơn 77% người dùng trực tuyến mua
hàng mỗi tháng. Như vậy, hầu hết các hoạt động của con người đã xuất hiện phổ biến
trên mạng Internet và các phương tiện truyền thông trực tuyến. Đặc biệt, các trang
thương mại điện tử ngày nay gia tăng hoạt động tương tác với người dùng thông qua
việc khuyến khích họ chia sẻ các bài đánh giá về sản phẩm và thể hiện quan điểm của
họ trên các trang web mua sắm (ví dụ Amazon, eBay v.v.) hoặc các trang mạng xã hội
(ví dụ facebook.com, Twitter). Khai phá các bài đánh giá này có thể hiểu được quan
điểm, tâm lý của người tiêu dùng từ đó giúp ích cho việc xây dựng các chiến lược của
doanh nghiệp như: chiến dịch tiếp thị, sản phẩm ưu tiên, giám sát danh tiếng [1], nó
cũng có thể được thực hiện để học hành vi của người tiêu dùng, thị trường mẫu, và dự
đoán xu hướng tiêu dùng của xã hội [2].
Vì sự quan trọng của khai phá quan điểm mà trong thời gian hơn hai thập kỷ qua,
các nhà nghiên cứu, các học giả, các tổ chức, và các doanh nghiệp quan tâm nghiên
cứu lĩnh vực này [3–7]. Theo Bing Liu, các nhiệm vụ khai thác quan điểm được chia
thành ba cấp độ chính: cấp độ văn bản, cấp độ câu và cấp độ cụm từ (cấp độ khía
cạnh) [3]. Ở cấp độ văn bản, nhiệm vụ chính là xem xét toàn bộ văn bản như đầu vào
và phân loại xem nó có thể hiện bất kỳ cảm xúc tổng thể nào hay không [8–10]. Cấp
độ câu, đầu vào là các câu được tách ra từ văn bản có chứa quan điểm. Đây là một cấp
độ phân tích chi tiết của mức văn bản, trong đó xác định tính phân cực cho mỗi câu và
mỗi câu có thể chứa quan điểm khác nhau [11–14]. Cả hai việc phân tích quan điểm ở
mức độ văn bản và mức độ câu chưa khám phá được rõ ràng điều gì được người dùng
thích hay không thích. Ví dụ, trong câu đánh giá sau: “The laptop’s sound is good, but
the battery life is very short”, phân tích quan điểm ở mức văn bản và mức câu khó xác
định được quan điểm thực sự mà người dùng đưa ra là gì. Khi xem xét đến các thuộc
tính chất lượng loa (Speaker Quality) và thời lượng pin (Battery Life) của máy tính
xách tay (laptop), các quan điểm được thể hiện cụ thể và rõ ràng hơn. Quan điểm trên
khía cạnh chất lượng loa là tích cực (good), và quan điểm trên khía cạnh thời lượng
pin là tiêu cực (very short). Mức độ phân tích này được gọi là phân tích quan điểm
ở mức độ khía cạnh. Hiện nay, phân tích quan điểm dựa trên khía cạnh đang thu hút
được nhiều sự quan tâm của cộng đồng nghiên cứu và các nhà phát triển ứng dụng [7].
Trong phân tích quan điểm dựa trên khía cạnh, việc tổng hợp hệ thống của các quan
điểm về các thực thể và các thuộc tính của chúng có thể được tạo ra.