Luận án Nghiên cứu phương pháp chuẩn hóa văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói Tiếng Việt

Người chia sẻ : vtlong
Số trang : 124 trang
Lượt xem : 42
Lượt tải : 500

Các file đính kèm theo tài liệu này

luan_an_nghien_cuu_phuong_phap_chuan_hoa_van_ban_va_nhan_dan.pdf

Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu phương pháp chuẩn hóa văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói Tiếng Việt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Trong xã hội hiện đại, thông tin có thể dễ dàng được tiếp cận trên phạm
vi toàn cầu nhờ hệ thống Internet rộng khắp. Bên cạnh thông tin dạng văn bản
thì thông tin dạng âm thanh, phim ảnh ngày càng trở nên phổ biến và thu hút
sự quan tâm của người sử dụng Internet nhờ hệ thống băng thông mạng ngày
càng được mở rộng. Mặc dù vậy, thông tin dưới dạng văn bản vẫn có giá trị
riêng biệt mà khó có dạng thức thông tin nào có thể thay thế được – nhất là
trong các hoạt động giao tiếp thuộc các lĩnh vực như: kinh tế, chính trị, ngoại
giao, khoa học. Kết quả các cuộc đàm phán, đối thoại song phương, đa
phương bao giờ cũng được hiện thực hóa bằng các văn bản ghi nhớ của các
bên liên quan.
Xử lý ngôn ngữ tự nhiên (XLNNTN) là lĩnh vực khoa học máy tính kết
hợp giữa trí tuệ nhân tạo và ngôn ngữ học tính toán, nhằm xử lý tương tác
giữa con người và máy tính sao cho máy tính có thể hiểu hay bắt chước được
ngôn ngữ của con người. XLNNTN bao gồm hai nhánh lớn là xử lý tiếng nói
(Speech processing) và xử lý văn bản (Text processing).
Một trong những bài toán quan trọng trong hiểu ngữ nghĩa văn bản viết
hay nói là nhận dạng thực thể định danh (Named Entity Recognition – NER).
Có thể nói, đây là một bài toán tiền đề cho các hệ thống về hiểu ngôn ngữ hay
khai phá văn bản như trích xuất sự kiện, hỏi đáp tự động hay tìm kiếm ngữ
nghĩa. Đã có nhiều nghiên cứu đạt được những kết quả rất khả quan cho bài
toán NER với dữ liệu văn bản viết thông thường trong nhiều ngôn ngữ trên
thế giới cũng như tiếng Việt. Trong khi đó, các nghiên cứu về nhận dạng thực
thể định danh cho văn bản đầu ra của nhận dạng tiếng nói (Automatic Speech
Recognition – ASR) có những khó khăn riêng so với văn bản viết, và có ít
công trình nghiên cứu cho tiếng Việt.

NHỮNG LUẬN VĂN LIÊN QUAN

Thạc Sĩ - Cao Học

Đề tài Nhượng quyền thương mại Co.op Mart

1. Tính thiết thực của đề tài Sau khi Việt Nam gia nhập WTO một sân chơi công bằng và khắc nghiệt, buộc chính phủ Việt Nam phải thay đổi việc quản lý mang tính bảo hộ một số ngành [...]

Download

Thạc Sĩ - Cao Học

Luận văn Xây dựng chiến lược kinh doanh bất động sản của BitexColand

1. Sự cần thiết của luận văn Việt Nam đã gia nhập Tổ chức Thương mại thế giới (WTO), trong xu thế toàn cầu hóa như hiện nay, các doanh nghiệp đang đứng trước những cơ hội lớn để xây [...]

Download

Thạc Sĩ - Cao Học

Luận văn Đo lường mức độ hài lòng khách hàng về dịch vụ giao nhận hàng không tại công ty cổ phần giao nhận vận tải và thương mại VinaLink

1.1 Trình bày vấn đề nghiên cứu Cùng với quá trình tự do hóa thương mại đang diễn ra rầm rộ trên toàn thế giới, các doanh nghiệp nhận ra rằng hài lòng khách hàng là một vũ khí chiến [...]

Download

Thạc Sĩ - Cao Học

Luận văn Giải pháp điều hành chính sách tỷ giá ở Việt Nam

Như chúng ta đ ã biết, tỷ giá hối đoái l à một công cụ kinh tế vĩ mô chủ yếu để điều tiết cán cân th ương mại quốc tế theo mục ti êu đã định trước của một [...]

Download