Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 144 trang
Dung lượng: 2 MB

Giới thiệu nội dung

Nghiên cứu phát triển hệ thống thích nghi giọng nói trong tổng hợp tiếng Việt và ứng dụng

Tác giả: Phạm Ngọc Phương

Lĩnh vực: Hệ thống Thông tin

Nội dung tài liệu:

Luận án này tập trung nghiên cứu và phát triển hệ thống tổng hợp tiếng nói tiếng Việt có khả năng thích nghi giọng nói. Mục tiêu chính là nâng cao chất lượng tổng hợp, tạo ra giọng nói mới mang đặc trưng âm học của người nói đích với chất lượng và độ tương đồng cao, sử dụng lượng dữ liệu mẫu nhỏ. Nghiên cứu đề xuất các phương pháp thích nghi dựa trên mạng nơ-ron sâu (DNN), bao gồm cả các mô hình yêu cầu huấn luyện lại và không yêu cầu huấn luyện lại, nhằm giải quyết các thách thức về chi phí, thời gian và nguồn lực trong việc tạo giọng nói cá nhân hóa.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục thuật ngữ
  • Danh mục các ký hiệu và từ viết tắt
  • Danh mục bảng
  • Danh mục các hình vẽ, đồ thị
  • Mở đầu
  • Chương 1: Các nghiên cứu liên quan và kiến thức cơ sở về tổng hợp và thích nghi giọng nói
  • Chương 2: Xây dựng cơ sở dữ liệu tiếng Việt
  • Chương 3: Mô hình tổng hợp thích nghi có huấn luyện với mẫu nhỏ (Few-shot TTS)
  • Chương 4: Mô hình tổng hợp thích nghi không huấn luyện với mẫu tối thiểu (Zero-shot TTS)
  • Kết luận
  • Danh mục các công trình công bố
  • Liên quan đến luận án
  • Danh mục tài liệu tham khảo
  • Phụ lục