Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 24 trang
Dung lượng: 397 KB

Giới thiệu nội dung

Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Tác giả: Nguyễn Hữu Đam

Lĩnh vực: Học viện Công nghệ Bưu chính Viễn thông

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, tập trung vào tiếng Việt. Cụ thể, luận văn xây dựng ứng dụng nhận dạng một số từ, các số và chuyển đổi âm thoại sang văn bản. Phương pháp sử dụng bao gồm mô hình Markov ẩn dựa trên các đặc trưng MFCC, cùng với việc tích hợp các kỹ thuật khử nhiễu như CMS để tăng cường hiệu quả của hệ thống. Các nội dung nghiên cứu về âm vị tiếng Việt, thanh điệu, cấu trúc âm tiết và các đặc điểm ngữ âm tiếng Việt cũng được trình bày chi tiết.

Mục lục chi tiết:

  • MỞ ĐẦU
  • Chương 1 – TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI
    • 1.1. Lý thuyết âm thanh và tiếng nói
      • 1.1.1. Nguồn gốc âm thanh
      • 1.1.2. Các đại lượng đặc trưng của dữ liệu âm thanh
      • 1.1.3. Các tần số của âm thanh
      • 1.1.4. Cơ chế tạo lập tiếng nói của con người
      • 1.1.5. Mô hình lọc nguồn tạo tiếng nói
      • 1.1.6. Hệ thống thính giác của người
      • 1.1.7. Quá trình tạo và thu nhận tiếng nói
      • 1.1.8. Mô hình lọc nguồn tạo tiếng nói
    • 1.2. Giới thiệu về xử lý tiếng nói
      • 1.2.1. Mục đích của xử lý tiếng nói
    • 1.3. Nhận dạng tiếng nói
      • 1.3.1. Bài toán nhận dạng tiếng nói
      • 1.3.2. Các phương pháp nhận dạng tiếng nói
    • 1.4. Nhận dạng tiếng Việt
      • 1.4.1. Đặc điểm âm tiết tiếng Việt
      • 1.4.2. Âm vị tiếng Việt
      • 1.4.3. Sự phân bố của các âm vị tiếng Việt
      • 1.4.4. Một số đặc điểm ngữ âm tiếng Việt
      • 1.4.5. Những thuận lợi và khó khăn đối với nhận dạng tiếng Việt