Luận văn Xây dựng hệ thống thu thập thông tin tự động phục vụ cập nhật nội dung cho trang web
- Người chia sẻ :
- Số trang : 26 trang
- Lượt xem : 6
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng hệ thống thu thập thông tin tự động phục vụ cập nhật nội dung cho trang web, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Sự phát triển nhanh chóng của mạng Internet kèm theo khối lượng dữliệu khổng lồ, ña dạng và tăng trưởng không ngừng. Đối với mọi cá nhân, tổ chức, việc cập nhật thường xuyên các nguồn thông tin trên mạng Internet là rất quan trọng, quyết ñịnh ñến hiệu quả, thành công, trong lĩnh vực hoạt ñộng của mình. Tuy nhiên, việc tìm kiếm ñược các thông tin phù hợp và có giá trị ñối với người truy cập từmạng Internet sẽtốn kém thời gian do dữliệu nằm phân tán trên mạng và không ñược sắp xếp, phân loại nhưmong muốn. Do ñó, việc tìm kiếm, trích lọc và thu thập các thông tin có ý nghĩa từ Internet vềmột ñiểm truy cập tập trung phục vụnhu cầu người khai thác là một bài toán cần thiết ñược giải quyết. Nhu cầu thu thập và phát lại các thông tin cần thiết từinternet ñối với trang TTĐT Quảng Nam là rất lớn. Là một cán bộ ñang công tác tại SởThông Tin & Truyền Thông Quảng Nam, ñơn vịquản lý cổng TTĐT này, tôi thiết nghĩcần thiết phải ñưa ra một giải pháp xây dựng hệthống thu thập thông tin tự ñộng phục vụcập nhật nội dung cho trang TTĐT . Từnhững lý do nhưtrên nên tôi chọn ñềtài: “Xây dựng hệ thống thu thập thông tin tự ñộng phục vụ cập nhật nội dung cho trang web”. Các nội dung chính nghiên cứu trong luận văn : – Tìm hiểu tổng quan kỹthuật thu thập thông tin trên Internet, tổng quan vềkhai phá dữliệu, các thuật toán phân cụm dữ liệu. – 4 — Tiếp cận bài toán Tìm kiếm và phân cụm tài liều web ứng dụng thuật toán K-means và các kỹthuật tiền xửlý và biểu diễn dữliệu. – Áp dụng Bài toán Tìm kiếm và phân cụm tài liệu web vào việc Xây dựng hệthống thu thập tin tự ñộng hỗtrợthu thập và biên tập các tin tức từcác nguồn trên Internet, phục vụ nhu cầu người truy cập một cách tập trung các tin tức liên quan ñến chủ ñềcần thu thập trên Trang TTĐT Quảng Nam
