Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 61 trang
Dung lượng: 901 KB

Giới thiệu nội dung

Mô hình Markov ẩn và ứng dụng xây dựng hệ thống nhận dạng tiếng nói

Tác giả: Nguyễn Thị Thu Huyền

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu về mô hình Markov ẩn (HMM) và các ứng dụng của nó trong việc xây dựng hệ thống nhận dạng tiếng nói tiếng Việt. Đề tài phân tích các phương pháp nhận dạng tiếng nói hiện có trên thế giới, từ đó lựa chọn phương pháp phù hợp để xây dựng hệ thống nhận dạng tiếng nói tiếng Việt. Cụ thể, luận văn tập trung vào việc xây dựng hệ thống nhận dạng tiếng Việt liên tục sử dụng mô hình Markov ẩn, với giới hạn phạm vi nghiên cứu là nhận dạng 10 chữ số.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Danh mục các hình ảnh
  • Danh mục các bảng biểu
  • Danh mục các từ viết tắt
  • Lời mở đầu
  • Chương 1: Một số kiến thức cơ bản về nhận dạng tiếng nói
    • 1.1. Khái niệm chung
      • 1.1.1. Khái niệm nhận dạng tiếng nói
      • 1.1.2. Phân loại nhận dạng tiếng nói
      • 1.1.3. Hệ thống nhận dạng tiếng nói tự động
    • 1.2. Các nghiên cứu hiện thời về nhận dạng tiếng nói
      • 1.2.1. Các nghiên cứu về nhận dạng tiếng nói ở nước ngoài
      • 1.2.2. Các nghiên cứu về nhận dạng tiếng nói tiếng Việt
    • 1.3. Các hướng tiếp cận nhận dạng tiếng nói
    • 1.4. Những khó khăn trong nhận dạng tiếng nói
    • 1.5. Xử lý tiếng nói
      • 1.5.1. Khái niệm xử lý tiếng nói
      • 1.5.2. Kỹ thuật lấy mẫu tín hiệu
      • 1.5.3. Cấu trúc bộ lọc tín hiệu
      • 1.5.4. Kỹ thuật dò tìm điểm cuối
      • 1.5.5. Kỹ thuật rút trích đặc trưng
      • 1.5.6. Phương pháp tính hệ số MFCC
    • 1.6. Sơ lược về ngôn ngữ tiếng Việt
      • 1.6.1. Giới thiệu về âm tiết
      • 1.6.2. Một số đặc điểm của âm tiết tiếng Việt
      • 1.6.3. Lý thuyết về âm vị
  • Chương 2: Tổng quan về mô hình mạng Markov ẩn
    • 2.1. Mô hình Markov ẩn
    • 2.2. Các bài toán cơ bản của mô hình Markov ẩn
      • 2.2.1. Bài toán 1
      • 2.2.2. Bài toán 2
      • 2.2.3. Bài toán 3
    • 2.3. Các thuật toán cơ bản
      • 2.3.1. Thuật toán tiến (forward)
      • 2.3.2. Thuật toán lùi (Backward)
      • 2.3.3. Các giải pháp giải quyết các bài toán cơ bản
    • 2.4. So sánh các loại mô hình Markov ẩn
  • Chương 3: Xây dựng hệ thống nhận dạng tiếng Việt
    • 3.1. Tổng quan về HTK (HMM Tool Kit)
      • 3.1.1. Giới thiệu hệ thống
      • 3.1.2. Mô hình các cấu trúc tập tin cơ bản khai báo HMM và MFCC cho nhận dạng tiếng nói
      • 3.1.3. Các bước xây dựng một mô hình nhận dạng tiếng nói sử dụng HTK
      • 3.1.4. Một số Modul sử dụng trong quá trình xây dựng hệ thống nhận dạng tiếng nói tiếng việt trong bộ công cụ HTK
    • 3.2. Xây dựng hệ thống nhận dạng chữ số Tiếng việt
      • 3.2.1. Xây dựng cơ sở dữ liệu chữ số tiếng việt
      • 3.2.2. Bảng phiên âm 10 chữ số tiếng Việt
      • 3.2.3. Phương pháp xây dựng hệ thống nhận dạng chữ số tiếng việt
      • 3.2.4. Các kết quả thực nghiệm
  • Kết luận
  • Tài liệu tham khảo