Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 69 trang
Dung lượng: 713 KB

Giới thiệu nội dung

Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Tác giả: Nguyễn Hữu Đam

Lĩnh vực: Kỹ thuật (Theo định hướng ứng dụng) – Hệ thống thông tin

Nội dung tài liệu:
Luận văn này tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản. Đề tài sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC, đồng thời tích hợp kỹ thuật khử nhiễu CMS để tăng tính hiệu quả của hệ thống. Nghiên cứu tập trung vào dữ liệu âm thanh tiếng Việt, xem xét các đặc trưng âm thanh cần thiết cho quá trình nhận dạng, các phương pháp tính hệ số và trích chọn đặc trưng MFCC, PLP, kỹ thuật khử nhiễu, mô hình Markov ẩn và các ứng dụng của nó trong nhận dạng tiếng nói rời rạc. Chương cuối trình bày kết quả thực nghiệm của hệ thống nhận dạng tiếng nói tiếng Việt và chuyển đổi âm thoại sang văn bản.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các thuật ngữ, chữ viết tắt
  • Danh sách hình vẽ
  • Mở đầu
  • Chương 1 – Tổng quan về nhận dạng tiếng nói
  • Chương 2 – Các kỹ thuật nhận dạng từ vựng trong âm thoại tiếng Việt
  • Chương 3 – Xây dựng hệ thống chuyển đổi âm thoại tiếng Việt sang văn bản
  • Kết luận và kiến nghị
  • Danh mục các tài liệu tham khảo
  • Phụ lục