Nghiên cứu ứng dụng mã nguồn mở lucene để xây dựng phần mềm tìm kiếm thông tin trên văn bản
- Người chia sẻ :
- Số trang : 10 trang
- Lượt xem : 7
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Nghiên cứu ứng dụng mã nguồn mở lucene để xây dựng phần mềm tìm kiếm thông tin trên văn bản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Trong bài báo này chúng tôi giới thiệu những nghiên cứu vềmã nguồn mởLucene và chỉ ra cách thức ứng dụng nó trong hệthống tìm kiếm. Lucene là dựán mã nguồn mở được cung cấp và quản lý bởi tổchức Apache Software Foundation, đây là công cụlập chỉmục cho văn bản, sửdụng trong hệthống tìm kiếm. Lucene cho phép xửlý các văn bản đầu vào ởdạng văn bản (text) đểtạo ra tập chỉmục và cung cấp phương thức tìm kiếm trên tập chỉmục đó. Nó cũng cho phép người dùng kếthừa và phát triển đểphù hợp với nhiều ngôn ngữkhác nhau. Chúng tôi đề xuất mô hình ứng dụng Lucene đểphát triển hệthống tìm kiếm trên các văn bản lưu trữ. Trong mô hình này, chúng tôi sửdụng mã nguồn của Lucene và xây dựng một sốxửlý cho ngôn ngữ tiếng Việt. Đầu tiên, chúng tôi tiến hành tách nội dung của các loại văn bản, sau đó thực hiện một sốxửlý cho tiếng Việt và lập chỉmục cho các văn bản, cuối cùng chúng tôi xây dựng các ứng dụng tìm kiếm sửdụng tập chỉmục này đểtruy vấn và lấy vềtài liệu liên quan.
