Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 59 trang
Dung lượng: 809 KB

Giới thiệu nội dung


Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm

Tác giả: Phạm Mạnh Cường

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:
Luận văn này tập trung nghiên cứu về phương pháp mã hóa tiếng nói tốc độ bit thấp, sử dụng kỹ thuật phân rã ma trận không âm (Nonnegative Matrix Factorization – NMF). Tiếng nói là phương tiện giao tiếp cơ bản và phổ biến nhất của con người, do đó việc mã hóa tiếng nói hiệu quả, đặc biệt là mã hóa tốc độ bit thấp, có vai trò quan trọng trong các hệ thống viễn thông hiện đại. Các phương pháp mã hóa truyền thống như PCM, LPC, ADPCM đã được tiêu chuẩn hóa và sử dụng rộng rãi, tuy nhiên hiệu quả nén của chúng vẫn chưa đáp ứng được yêu cầu trong điều kiện tài nguyên hạn chế. Kỹ thuật NMF, được đề xuất bởi Xue năm 2008, cho thấy tiềm năng lớn trong việc phân tích và mã hóa tiếng nói. Luận văn đi sâu vào phân tích lý thuyết, cài đặt thực nghiệm trên cơ sở dữ liệu tiếng Việt và đánh giá hiệu quả của phương pháp NMF, từ đó đưa ra các khuyến nghị cho việc phát triển hệ thống mã hóa tiếng nói tốc độ bit thấp thời gian thực phù hợp với tiếng nói tiếng Việt.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Danh mục các bảng
  • Danh mục các hình
  • Ý nghĩa các từ viết tắt
  • Mở đầu
    • Lý do chọn đề tài
    • Đối tượng và phạm vi nghiên cứu
    • Hướng nghiên cứu của luận văn
    • Phương pháp nghiên cứu
    • Ý nghĩa khoa học và thực tiễn
  • Chương 1: Tổng quan về mã hóa tiếng nói
    • Tổng quan về tiếng nói
      • Thông tin tiếng nói
      • Tín hiệu tiếng nói
        • Tín hiệu
        • Nguồn tín hiệu
        • Hệ thống và xử lý tín hiệu
    • Tổng quan về mã hóa tiếng nói
    • Mã hóa tiếng nói tốc độ bit thấp
    • Mục tiêu của luận văn
  • Chương 2: Phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm NMF
    • Tổng quan về kỹ thuật phân rã ma trận không âm NMF
      • Khái niệm
      • Lịch sử
      • Nền tảng
      • Tích chất phân cụm
    • Kỹ thuật phân rã ma trận không âm NMF và ứng dụng trong mã hóa tiếng nói
      • Kỹ thuật phân rã ma trận không âm NMF
      • Ứng dụng trong mã hóa tiếng nói
    • Phương pháp mã hóa tiếng nói dùng NMF của Xue
    • Phương pháp mã hóa NMF của Chien
  • Chương 3: Đánh giá thực nghiệm phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm NMF
    • Thu thập dữ liệu tiếng nói
      • Ngữ âm tiếng Việt
        • Cấu trúc âm tiết tiếng Việt
        • Thanh điệu tiếng Việt
      • Cơ sở dữ liệu tiếng nói tiếng Việt
        • Cơ sở dữ liệu tiếng nói phát thanh VOV
        • Cơ sở dữ liệu DEMEN567
        • Cơ sở dữ liệu MICA VNSpeech
      • Tổng hợp tiếng nói tiếng Việt
    • Cài đặt phương pháp mã hóa trên Matlab
    • Đánh giá khách quan, chủ quan và so sánh các phương pháp
      • Đánh giá khách quan và chủ quan
      • So sánh với các phương pháp khác
    • Phân tích, đánh giá ưu nhược điểm
  • Kết luận
  • Tài liệu tham khảo