Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 27 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Nghiên cứu phát triển hệ thống thích nghi giọng nói trong tổng hợp tiếng Việt và ứng dụng

Tác giả: Phạm Ngọc Phương

Lĩnh vực: Hệ thống thông tin

Nội dung tài liệu:

Luận án này tập trung nghiên cứu và phát triển hệ thống tổng hợp tiếng nói thích nghi cho tiếng Việt, nhằm cá nhân hóa giọng nói tổng hợp và nhân bản giọng nói. Nghiên cứu giải quyết những thách thức của tiếng Việt là một ngôn ngữ nghèo tài nguyên, chi phí cao và tốn nhiều thời gian để tạo ra giọng nói tổng hợp. Luận án đề xuất các phương pháp cải tiến chất lượng tổng hợp tiếng nói, đặc biệt là khả năng thích nghi với lượng dữ liệu mẫu nhỏ (Few-shot TTS) và không cần huấn luyện lại mô hình (Zero-shot TTS). Bên cạnh đó, nghiên cứu còn nhấn mạnh việc xây dựng bộ cơ sở dữ liệu tiếng Việt chi phí thấp, đảm bảo chất lượng và độ đa dạng, làm nền tảng cho các hệ thống tổng hợp và thích nghi tiếng nói.

Mục lục chi tiết:

  • Chương 1: Các nghiên cứu liên quan và kiến thức cơ sở về tổng hợp và thích nghi tiếng nói
  • Chương 2: Xây dựng cơ sở dữ liệu tiếng Việt chi phí thấp cho tổng hợp và thích nghi tiếng nói
  • Chương 3: Mô hình tổng hợp thích nghi có huấn luyện với mẫu nhỏ (Few-shot TTS)