Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 49 trang
Dung lượng: 953 KB

Giới thiệu nội dung


Nghiên cứu Hệ Thống Tổng Hợp Tiếng Nói Theo Phương Pháp Học Sâu

Tác giả: Lê Thanh Tùng

Lĩnh vực: Hệ Thống Thông Tin

Nội dung tài liệu:
Luận văn thạc sĩ này tập trung nghiên cứu về hệ thống tổng hợp tiếng nói tiếng Việt, đặc biệt là việc ứng dụng phương pháp học sâu. Quá trình tổng hợp tiếng nói, bao gồm hai thành phần chính là xử lý ngôn ngữ tự nhiên và xử lý tổng hợp tiếng nói, được trình bày chi tiết. Luận văn đi sâu vào các phương pháp tổng hợp tiếng nói khác nhau, từ các phương pháp truyền thống như tổng hợp mô phỏng hệ thống phát âm, tổng hợp tần số formant, tổng hợp ghép nối, đến các phương pháp dựa trên mô hình Markov ẩn và đặc biệt là phương pháp học sâu. Các kiến trúc mạng nơ ron học sâu, bao gồm mạng nơ ron thần kinh và mạng nơ ron học sâu, cùng với các bài toán học máy liên quan, được giới thiệu. Luận văn cũng đề cập đến các đặc trưng của ngôn ngữ tiếng Việt trong tổng hợp tiếng nói. Phần thực nghiệm và đánh giá hệ thống được trình bày rõ ràng, bao gồm môi trường, bộ dữ liệu, mô hình huấn luyện và phương pháp đánh giá. Cuối cùng, luận văn đưa ra kết luận về kết quả đạt được, đánh giá hệ thống và đề xuất hướng phát triển.

Mục lục chi tiết:

  • Lời cảm ơn
  • Lời cam đoan
  • Mục lục
  • Danh mục hình vẽ
  • Danh mục bảng biểu
  • Mở đầu
  • Chương 1: Giới thiệu về tổng hợp tiếng nói
    • 1.1. Tổng quan về tổng hợp tiếng nói
      • 1.1.1. Khối xử lý ngôn ngữ tự nhiên
      • 1.1.2. Khối tổng hợp tín hiệu tiếng nói
    • 1.2. Các phương pháp tổng hợp tiếng nói
      • 1.2.1. Tổng hợp mô phỏng hệ thống phát âm
      • 1.2.2. Tổng hợp tần số formant
      • 1.2.3. Tổng hợp ghép nối
      • 1.2.4. Tổng hợp dùng tham số thống kê
        • 1.2.4.1. Pha huấn luyện
        • 1.2.4.2. Pha tổng hợp
      • 1.2.5. Tổng hợp tiếng nói bằng phương pháp lai ghép
      • 1.2.6. Tổng hợp tiếng nói dựa trên phương pháp học sâu
      • 1.2.7. Tổng hợp tiếng nói theo phương pháp End-to-End
      • 1.2.8. Các phương pháp và độ đo đánh giá hiệu năng hệ thống tổng hợp tiếng nói
    • 1.3. Tình hình phát triển hệ thống tổng hợp tiếng nói ở Việt Nam
  • Chương 2: Mạng nơ ron học sâu và đặc trưng ngôn ngữ trong tổng hợp tiếng nói
    • 2.1. Mạng nơ ron học sâu
      • 2.1.1. Mạng nơ ron thần kinh
      • 2.1.2. Mạng nơ ron học sâu
    • 2.2. Bài toán học máy
    • 2.3. Đặc trưng của ngôn ngữ tiếng Việt
      • 2.3.1. Tổng quan về âm học
      • 2.3.2. Các đặc trưng của âm học
  • Chương 3: Hệ thống tổng hợp tiếng nói theo phương pháp học sâu
    • 3.1. Pha huấn luyện
      • 3.1.1. Khối trích chọn đặc trưng ngôn ngữ
      • 3.1.2. Mô hình thời gian
      • 3.1.3. Mô hình âm học
      • 3.1.4. Khối trích trọn đặc trưng tiếng nói
    • 3.2. Pha kiểm thử
  • Chương 4: Thực nghiệm và đánh giá
    • 4.1. Thực nghiệm
      • 4.1.1. Môi trường thực nghiệm
      • 4.1.2. Bộ dữ liệu sử dụng trong thực nghiệm
      • 4.1.3. Mô hình huấn luyện
      • 4.1.4. Tạo ra tiếng nói tiếng Việt từ mô hình mạng nơ ron học sâu
    • 4.2. Đánh giá kết quả
      • 4.2.1. Phương pháp đánh giá
      • 4.2.2. Bảng so sánh tiếng nói tổng hợp từ 2 mô hình DNN và HMM
      • 4.2.3. Kết quả đánh giá
  • Chương 5: Kết luận
    • 5.1. Kết quả đạt được của luận văn
    • 5.2. Đánh giá hệ thống
    • 5.3. Hướng phát triển
  • Tài liệu tham khảo