Đề tài Tìm hiểu bài toán khai phá dữ liệu văn bản
- Người chia sẻ :
- Số trang : 53 trang
- Lượt xem : 7
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Đề tài Tìm hiểu bài toán khai phá dữ liệu văn bản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Trong thời đại ngày nay, thông tin là nhu cầu thiết yếu đối với mọi ngƣời trên mọi lĩnh vực. Mỗi phút trôi qua hàng triệu triệu trang web đƣợc đẩy lên nhằm làm giàu nguồn tài nguyên vô tận này. Vấn đề đặt ra là làm sao ta có thể nắm bắt, cập nhật, chia sẻ thông tin một cách tổng quát, nhanh chóng và dễ dàng trong một khối lƣợng thông tin khổng lồ nhƣ vậy. Do đó đòi hỏi phải khai phá nguồn dữ liệu đó để lấy đƣợc những thông tin có ích một cách tự động. Trên thế giới hiện nay, rất nhiều website cung cấp tập tin RSS để chia sẻ và cập nhật thông tin một cách dễ dàng và nhanh chóng. Một số website hỗ trợ đọc tin RSS nhƣ: Google Reader, Yahoo, và một số phần mềm nhƣ: RSSReader, FeedDemon. Còn hiện tại ở Việt Nam, có một số phần mềm hỗ trợ Tìm hiểu bài toán khai phá dữ liệu văn bản 5 đọc tin nhƣ: Vietspider, iCA và website hỗ trợ đọc tin RSS trực tuyến thì chƣa nhiều. Chính vì vậy đề tài “Tìm hiểu bài toán khai phá dữ liệu văn bản” đƣợc đƣa ra nhằm ứng dụng khai phá dữ liệu vào việc xây dựng hệ thống thu thập tin tức từ nhiều nguồn website khác giúp cho ngƣời dùng có thể nắm bắt thông tin một cách dễ dàng và tiết kiệm thời gian. Nội dung đề tài gồm các phần chính sau: Chƣơng 1 – Khái quát về khai phá dữ liệu Tìm hiểu khái niệm, quá trình và các bài toán trong khai phá dữ liệu. Chƣơng 2 – Khai phá dữ liệu trong lấy tin tự động Nội dung của chƣơng 2 là tìm hiểu về lấy tin tự động và ứng dụng khai phá dữ liệu trong lấy tin tự động (tìm hiểu ngôn ngữ XML và công nghệ RSS ) Chƣơng 3 – Phân tích thiết kế chƣơng trình Nội dung của chƣơng 3 là quá trình khảo sát, phân tích và thiết kế chi tiết cho chƣơng trình hỗ trợ đọc tin RSS. Chƣơng 4 – Xây dựng chƣơng trình Nêu ra các lớp, phƣơng thức cơ bản để xây dựng website hỗ trợ đọc tin RSS. Và cuối cùng là đƣa một số màn hình giao diện đạt đƣợc. Kết luận và phƣơng hƣớng phát triển
