Ứng dụng thuật toán phân lớp rút trích thông tin văn bản FSVM trên internet
- Người chia sẻ :
- Số trang : 12 trang
- Lượt xem : 7
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Ứng dụng thuật toán phân lớp rút trích thông tin văn bản FSVM trên internet, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Hiện đã có một sốnghiên cứu vềrút trích văn bản và phân loại văn bản, trong bài báo này nhóm nghiên cứu tìm hiểu các kỹthuật trên và áp dụng vào một ứng dụng thực tếlà thu thập và phân loại thông tin trên các trang báo điện tửphục vụcho việc cung cấp tin tức trên các trang web hành chính thành phố. Các thông tin này có thểdo các cơquan tựcung cấp hoặc thu thập được trên các trang web của Bộ, Chính phủvà các trang báo điện tửkhác. Phần thu thập thông tin sửdụng phương pháp nhận dạng mẫu [2],[9], [11] đểcó thểtự động rút trích thông tin từcác trang web tin tức. Phần phân loại thông tin tác giảsửdụng kỹthuật phân loại văn bản Fuzzy Support Vector Machines (FSVMs) [12] kết hợp với phân loại đa lớp mờ[5] do kết quảphân loại rất tốt của phương pháp này theo các đềtài đã nghiên cứu 0, [5], [8], [12].
