Luận văn Nhận dạng tiếng nói tiếng Việt sử dụng mạng nơ – Ron nhân tạo và mô hình markov ẩn
- Người chia sẻ :
- Số trang : 13 trang
- Lượt xem : 8
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Luận văn Nhận dạng tiếng nói tiếng Việt sử dụng mạng nơ – Ron nhân tạo và mô hình markov ẩn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Tiếng nói là phương tiện giao tiếp cơbản và rộng rãi nhất của loài người, nó hình thành và phát triển song song với quá trình tiến hóa của loài người. Đối với con người, sửdụng lời nói là một cách diễn đạt đơn giản và hiệu quảnhất. Ưu điểm của việc giao tiếp bằng tiếng nói trước tiên là ởtốc độgiao tiếp, tiếng nói từngười nói được người nghe hiểu ngay lập tức sau khi được phát ra. Từ khi ngành công nghiệp máy tính phát triển, nhiều công trình nghiên cứu trên tiếng nói nhằm khai thác các thông tin từtiếng nói để ứng dụng trong nhiều lĩnh vực như hệ thống trả lời điện thoại tự động, dịch vụ tra cứu thông tin du lịch bằng tiếng nói, và ứng dụng nhận dạng tiếng nói trong các hệthống bảo mật đã đem lại nhiều lợi ích và cách thức giao tiếp thuận tiện hơn cho con người. Lĩnh vực nghiên cứu nhận dạng tiếng nói đã được bắt đầu từcuối thập kỷ40, các nghiên cứu và ứng dụng vềxửlý ngôn ngữnói chung trên thếgiới và nhiều nước khác đã trải qua nhiều giai đoạn, và điều quan trọng hơn cảlà nhiều cách tiếp cận và cách thức xửlí ngôn ngữ đã được trải nghiệm và thừa nhận. ỞViệt Nam, lĩnh vực nhận dạng và xửlý tiếng nói tiếng Việt vẫn còn khá mới, theo người viết luận văn được biết, các tập thểlàm nghiên cứu đã có những kết quảgần đây là Viện Công nghệThông tin, Trường Đại học KHTN TPHCM và Trung tâm nghiên cứu quốc tếThông tin đa phương tiện, truyền thông và ứng dụng (MICA) – ĐHBK Hà nội, cộng với một số đềtài nghiên cứu thạc sĩ, tiến sĩ trên cả nước; nhìn chung các đề tài tập trung xửlý tiếng nói tiếng Việt trên tập dữliệu nhỏvà vừa, phụthuộc và độc lập người nói, khả năng xử lý nhiễu của tín hiệu còn thấp, thường áp dụng hướng tiếp cận nhận dạng đối sánh mẫu như nắn chỉnh thời gian động (DTW), các mô hình Markov ẩn rời rạc dẫn đến một số kết quả chỉ mang tính chất tìm hiểu, chưa hệthống và định hướng rõ ràng, có hiệu suất nhận dạng từ88% – 96% [1][2][3]. Vì ý nghĩa đó và được sự đồng ý hướng dẫn của Thầy PGS.TS Phan Huy Khánh, tôi đã chọn đềtài “Nhận dạng tiếng nói tiếng Việt sửdụng mạng nơ-ron nhân tạo và mô hình Markov ẩn” thực hiện với mong muốn đóng góp một giải pháp trong lĩnh vực nhận dạng tiếng nói tiếng Việt
