Đồ án Xây dựng hệ thống tìm kiếm thông tin tiếng Việt dựa trên các chỉ mục có cấu trúc

  • Người chia sẻ :
  • Số trang : 117 trang
  • Lượt xem : 18
  • Lượt tải : 500
  • Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Đồ án Xây dựng hệ thống tìm kiếm thông tin tiếng Việt dựa trên các chỉ mục có cấu trúc, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Trong thời đại bùng nổ thông tin như hiện nay, thông tin được lưu trữ trên máy tính ngày càng nhiều do đó việc tìm kiếm thông tin chính xác là nhu cầu thiết yếu đối với mọi người trong mọi lĩnh vực. Internet hiện nay đă trở thành một kho tư liệu khổng lồ mà việc tìm kiếm thông tin trên kho tư liệu này cần phải được hỗ trợ bởi các công cụ tìm kiếm (search engine) tốt. Các hệ thống tìm kiếm thông tin thông dụng như Google, Yahoo Search đã đáp ứng được phần nào nhu cầu đó của mọi người. Tuy nhiên, các hệ thống này được xây dựng để xử lý và tìm kíếm các văn bản tiếng Châu Âu, chúng chưa thật sự phù hợp cho các văn bản tiếng Việt. Do đó nhu cầu phải có một công cụ tìm kiếm “hiểu” và xử lý tốt các văn bản tíếng Việt. Các hệ tìm kiếm thông tin đều phải thực hiện giai đoạn lập chỉ mục (indexing) cho văn bản để trích các từ chỉ mục (index term) biểu diễn tốt nhất nội dung của văn bản. Giai đoạn này phụ thuộc vào ngôn ngữ của văn bản và phương pháp xử lý tự động ngôn ngữ đó. Hiện nay chưa có nhiều hệ thống tìm kiếm thông tin trên kho tài liệu tiếng Việt có khai thác các đặc trưng của tiếng Việt cho việc lập chỉ mục. Vì vậy mục tiêu của luận văn này nhằm xây dựng một hệ thống tìm kiếm thông tin bằng tiếng Việt có sử dụng các kết quả của xử lý ngôn ngữ tự nhiên tự động để xác định được các chỉ mục là các từ (word) hay từ ghép (compound word) của tiếng Việt.