Đề tài Trích chọn thông tin trên tập văn bản pháp luật dùng kỹ thuật học máy bán giám sát dựa trên mô hình crfs theo tiêu chuẩn kỳ vọng tổng quát
- Người chia sẻ :
- Số trang : 51 trang
- Lượt xem : 13
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Đề tài Trích chọn thông tin trên tập văn bản pháp luật dùng kỹ thuật học máy bán giám sát dựa trên mô hình crfs theo tiêu chuẩn kỳ vọng tổng quát, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Trích chọn thông tin là một khâu cơ bản trong bài toán khai phá dữliệu. Ngày nay, cùng với sựphát triển của công nghệthông tin, Tin học đã dần được ứng dụng rộng rãi trong nhiều lĩnh vực như kinh tế, thương mại, y tế, ngân hàng và mang lại nhiều lợi ích to lớn. Bản thân tôi hiện đang công tác tại Học việ n Cảnh sát nhân dân, tôi có những hiểu biết nhất định vềcông tác giữgìn trật tựan toàn xã hội của lực lượng cảnh sát nhân dân. Tôi nhận thấy, các hoạt động của lực lượng cảnh sát có liên quan nhiều đến việc lưu trữ h ồsơ dữ li ệu, tra cứu, phân tích tổng hợp dữliệu. Tuy nhiên, công tác quản lý hồsơ dữliệu này vẫn còn kém hiệu quảdo những hạn chếnhất định. Do đó tôi đã mạnh dạnchọn đề tài tập trung nghiên cứu vào việc trích lọc thông tin trên tập văn bản pháp luật này. Trong nhiều thập kỷqua, các nhà khoa học quan tâm đến lĩnh vực xử lý ngôn ngữtựnhiên đã nghiên cứu và đềxuất được nhiều phương pháp, mô hình xửlý ngônngữvới hiệu quảcao. Nổi bật trong sốđó là phương pháp học máy bán giám sát dựa trên mô hình trường ngẫu nhiên có điều kiện theo tiêu chuẩ n kỳvọng tổng quát, phương pháp này đạt được kết quảrất khảquan trên tập dữ liệu ngôn ngữtiếng Anh và hiện chưađược áp dụng cho tiếng Việt. Được sự giúp đỡvà đồng ý của Thầy giáo hướng dẫn TS. Nguyễn Lê Minh,tác giảquyết định sửdụng mô hình này ứng dụng cho tập văn bản pháp luật. Bốcục của luận văn chia thành 4 chương như sau: Chương 1: Trình bày những kiến thức cơ bản về mô hình trường ngẫu nhiên có điều kiện và phương pháp học máy bán giám sát. Chương 2: Trình bày vềtiêu chuẩn kỳ vọng tổng quát và áp dụng tiêu chuẩn kỳvọng tổng quát vàomô hình trường ngẫu nhiên có điều kiện. Chương 3: Trình bày vềbài toán trích chọn thưc thểtrên tập văn bản pháp luật và đềxuất mô hình giải quyết bài toán dựa trên mô hình CRFs theo tiêu chuẩn kỳvọng tổng quát. Chương 4: Trình bày các thực nghiệ m trên tập dữliệu sửdụng một sốmô hình học máy có giám sát CRFs, và mô hình học máy bán giám sát CRFs theo chuẩn hóa entropy và theo tiêu chuẩn kỳvọngtổng quát; Từ đó đánh giá kết quảthu được.
