Khóa luận trích chọn quan hệ thực thể trên wikipedia tiếng việt dựa vào cây phân tích cú pháp

  • Người chia sẻ :
  • Số trang : 68 trang
  • Lượt xem : 8
  • Lượt tải : 500
  • Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Khóa luận trích chọn quan hệ thực thể trên wikipedia tiếng việt dựa vào cây phân tích cú pháp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Trích chọn quan hệ ngữ nghĩa được xem là bài toán cơ bản của xử lý ngôn ngữ tự nhiên nhận được sự quan tâm rất lớn từ các nhà nghiên cứu, các hội nghị lớn trên thế giới[1, 8, 40]. Tại Việt Nam, bài toán này vẫn đặt ra rất nhiều các thách thức do tính phức tạp của ngôn ngữ tiếng Việt và sự không đầy đủ của các tài nguyên ngôn ngữ học. Trên cơ sở phân tích ưu và nhược điểm của các phương pháp trích chọn quan hệ, khóa luận áp dụng phương pháp trích chọn quan hệ dựa trên đặc trưng để giải quyết bài toán này. Các đặc trưng biểu thị quan hệ được trích chọn dựa trên cây phân tích cú pháp tiếng Việt, sau đó được đưa vào bộ phân lớp SVM tìm được loại quan hệ tương ứng, từ đó trích chọn được các thể hiện của quan hệ. Hơn nữa, nhằm giảm công sức cho giai đoạn xây dựng tập dữ liệu học, khóa luận khai thác tính giàu cấu trúc của dữ liệu trên Wikipedia tiếng Việt để xây dựng tập dữ liệu học bán tự động.