Mô hình maximum entropy và ứng dụng
- Người chia sẻ :
- Số trang : 60 trang
- Lượt xem : 12
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Mô hình maximum entropy và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Trong những năm gần đây, với sựphát triển mạnh mẽcủa công nghệthông tin và nhu cầu sửdụng Internet của tất cảmọi người trên thếgiới đã làm tăng vọt lượng thông tin giao dịch trên Internet. Vì vậy mà sốlượng văn bản xuất hiện trên Internet tăng nhanh chóng mặt cảvềsốlượng và chủ đề. Với khối lượng thông tin đồsộnhưvậy, để tìm được những thông tin cần thiết cho mục đích của chúng ta sẽmất rất nhiều thời gian và công sức. Một câu hỏi được đặt ra, làm thếnào có thểtổchức và tìm kiếm thông tin một cách nhanh chóng và hiệu quảnhất? Và câu trảlời hợp lý cho câu hỏi trên là phân loại thông tin tự động bằng máy tính. Trong luận văn này, em tập trung tìm hiểu vềmô hình cực đại entropy và áp dụng mô hình đểxây dựng chương trình phân loại văn bản Tiếng Việt tự động dựa trên tập dữ liệu huấn luyện. Từ đó hướng tới việc xây dựng chương trình chặn nội dung web bằng việc phân tích nội dung web. Hiện nay, việc kiểm soát truy cập Internet vẫn chưa đạt được hiệu quảtốt. Những trang web với nội dung xấu vẫn được truy cập rất dễdàng mà không có bất kỳsựkiểm soát nào. Với chương trình chặn nội dung web, em hy vọng có thểgiúp ngăn chặn được những trang web có nội dung xấu. Bên cạnh đó, cũng giúp mọi người có thểlọc ra được những trang web có nội dung phù hợp với nhu cầu của từng người trong những lĩnh vực riêng biệt.
