Luận văn Xử lý ngữ nghĩa trong hệ dịch tự động Anh – Việt cho các tài liệu tin học
- Người chia sẻ :
- Số trang : 154 trang
- Lượt xem : 11
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Luận văn Xử lý ngữ nghĩa trong hệ dịch tự động Anh – Việt cho các tài liệu tin học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Những năm gần đây, với sựphát triển nhanh chóng trong lĩnh vực công nghệ thông tin, việc sửdụng các tài liệu đểcó thểnắm bắtđược các tri thức mới vô cùng phổbiến. Song một khó khăn lớn đối với nhiều người Việt chúng ta hiện nay là việc hiểu ngôn ngữ đượcthểhiện trong các tài liệu (mà chủyếu là tiếng Anh). Do đó, tạo lập một hệthống chỉdịch các tài liệu tin học từtiếng Anh sang tiếng Việt có ý nghĩa to lớn. Chắc chắn nó sẽgiúp nhiều người Việt có điều kiện tiếp cận tốt các nội dung, kiến thức mới của tin học trên thếgiới. Nhưng vấn đềkhó khăn nhất gặp phải trong việc thiết lập một hệdịch tự động là tính nhập nhằng vốn có của ngôn ngữtựnhiên, trong đó nhập nhằng lớn nhất là nhập nhằng ngữnghĩa. Việc chọn ra mộtnghĩa thích hợp cho từlà một công việc không dễdàng nhưng cực kỳlý thú. Giải quyết tốt vấn đềngữnghĩa sẽnâng cao chất lượng cho hệdịch tự động Anh–Việt. Đềtài này hướng đến việc giải quyết tốt những nhập nhằng nghĩacủa từ trong các tài liệu tin họcnhờvào việc huấn luyện trên ngữliệu song ngữ đểrút ra các luật chuyển đổi. Thông qua việc kết hợp các khối khác của dịch tự động, tạo ra các câu dịch tiếng Việt có thểhiểu được. Sựthay đổi lĩnh vực xem xét không ảnh hưởng nhiều đến cấu trúc của mô hình. Chúng tôi thực hiện việc giới hạn lĩnh vực ngoài ý nghĩa nêu phía trên còn có lý do thửnghiệm mô hình xửlý ngữnghĩa mới, xem xét tính tương hỗtừcác thông tin trong ngữliệu song ngữvà đảm bảo chất lượng câu dịch. Luận văn được tổchức thành 5 chương và các phụlục. – Chương 1 giới thiệu tổng quan vềdịch máy nói chung và xửlý ngữ nghĩa nói riêng. – Chương 2 giới thiệu các cơsởlý thuyết cần sửdụng, trongđó có đề cập đến thuật toán huấn luyện. – Chương 3 đưa ra mô hình càiđặt cho khối xửlý ngữnghĩa – Chương 4 cụthểhoá mô hình càiđặt – Chương 5 tổng kết luận văn và đềra hướng phát triển.
