Đồ án Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán

Người chia sẻ :
Số trang : 77 trang
Lượt xem : 24
Lượt tải : 500

Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Đồ án Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Trong cuộc sống, tiếng nói đóng một vai trò rất quan trọng đối với con người. Cùng với tiếng nói là sựxuất hiện của rất nhiều các loại dịch vụthoại như ngày nay. Tuy nhiên việc bảo toàn được tín hiệu tiếng nói trên các dịch vụnày là điều vô cùng khó khăn do sựmất mát và suy giảm tín hiệu và nhất là ảnh hưởng của nhiễu sẽlàm cho tín hiệu tiếng nói không còn nhưban đầu. Vì lý do đó mà các thuật toán vềSpeech Enhancement ra đời. Tuy không thểbảo toàn được y nguyên tín hiệu ban đầu nhưng sửdụng các thuật toán này ta có thểtăng cường được chất lượng tiếng nói và giảm bớt nhiễu nền đểtín hiệu sau khi xửlý đến người nghe vẫn mang đầy đủnội dung thông tin vàkhông gây khó chịu bởi nhiễu đối với người nghe. Vì vậy, Speech Enhancement đóng một vai trò rất quan trọng trong lĩnh vực thoại. Xuất phát từthực tếnày nhóm đã bắt tay vào tìm hiểu vềSpeech Enhancement, nghiên cứu các thuật toán của nó đểthực hiện và đánh giá hiệu quảcủa các thuật toán đó trong môi trường thực tế. Đểthực hiện được đồán, nhóm đã phân chia thành 3 phần tương ứng với 3 thành viên : – Nguyễn Ngọc Trung: nghiên cứu và thực hiện thuật toán xửlý tiếng nói sửdụng phương pháp Spectral Subtraction. – Nguyễn Phúc Nguyên: nghiên cứu và thực hiện thuật xửlý tiếng nói sử dụng bộlọc Wiener. – Nguyễn ThịNgọc Diệp: nghiên cứu và thực hiện các phương pháp đánh giá từcác kết quả đạt được của 2 thuật toán trên trong môi trường thực tế. Đểthực hiện được nội dung phần của em thì đồán của em được kết cấu thành 2 phần, gồm 5 chương : Phần 1 : Lý thuyết Chương 1 : Tổng quan vềnâng cao chất lượng tiếng nói. Chương này giới thiệu một sốkhái niệm cơbản vềtín hiệu số, các phép biến đổi, tìm hiểu vềcác loại nhiễu , tín hiệu tiếng nói và sựhình thành tiếng nói. Bên cạnh đó còn giới thiệu khái quát vềmột sốthuật toán trong Speech Enhancement . Chương 2 : Đánh giá chất lượng tiếng nói. Chương này giới thiệu một số phương pháp đánh giá hiệu quảcủa thuật toán giảm nhiễu trong tiếng nói. Gồm có đánh giá chủquan và đánh giá khách quan. Chương 3 : Thuật toán Spectral Subtraction và Wiener Filtering. Chương này đi sâu vào nghiên cứu nguyên lý cơbản của từng thuật toán. Phần 2 : Thực hiện và đánh giá Chương 4 : Thực hiện và đánh giá thuật toán. Chương này trình bày các kết quảnhóm đã làm được gồm có thực hiện giảm nhiễu tín hiệu tiếng nói bằng hai thuật toán đã nghiên cứu ởchương 3. Đồng thời so sánh kết quảthu được bằng cách dùng các phương pháp đánh giá đã được giới thiệu ởchương 2 Phương pháp nghiên cứu của đồán là xây dựng lưu đồcủa thuật toán, thực hiện xửlý tiếng nói bằng các thuật toán đó. Dựa trên các kết quả đạt được sau khi xửlý, sau đó sửdụng các phương pháp đánh giá khách quan để đánh giá tính hiệu quảcủa các thuật toán xửlý trong môi trường thực tế. Đồán của nhóm đã thực hiện được 2 thuật toán xửlý tiếng nói trong Speech Enhancement và đưa ra được các kết quả đánh giá khách quan làm cơsở để đánh giá tính hiệu quảcủa 2 thuật toán trên. Đó chính là điểm mới trong đồán của nhóm so với các đồán đã có trước trong cùng chủ đềnghiên cứu