Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 16 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Anthropomorphic Coding of Speech and Audio: A Model Inversion Approach

Tác giả: Christian Feldbauer, Gernot Kubin, W. Bastiaan Kleijn

Lĩnh vực: Signal Processing and Speech Communication Laboratory, Graz University of Technology; Department for Signals, Sensors and Systems, KTH (Royal Institute of Technology)

Nội dung tài liệu:

Nghiên cứu này giới thiệu một phương pháp mã hóa âm thanh và giọng nói dựa trên mô hình thính giác có thể đảo ngược. Mục tiêu là cung cấp một hướng dẫn về cách trích xuất các đặc trưng âm thanh phù hợp nhất với người nghe bằng cách sử dụng mô hình thính giác có thể đảo ngược. Phương pháp này chuyển đổi tín hiệu âm thanh thành một biểu diễn thính giác, sau đó được lượng tử hóa và mã hóa. Khi giải mã, biểu diễn này được biến đổi trở lại miền âm thanh. Quá trình này đơn giản hóa tiêu chí độ méo phức tạp thành một tiêu chí đơn giản, giúp giảm độ phức tạp của quá trình lượng tử hóa. Nghiên cứu cũng xem xét các công việc trước đây về mô hình thính giác và chi tiết quy trình đảo ngược mô hình, cho phép tái tạo tín hiệu từ biểu diễn thính giác. Phương pháp này cũng tận dụng sự dư thừa của hệ thống thính giác con người để mã hóa mô tả kép (mã hóa nguồn-kênh kết hợp).

Mục lục chi tiết:

  • 1. Introduction
  • 2. Auditory Analysis
  • 3. Auditory Synthesis
  • 4. Exemplary Applications in Audio and Speech Coding
  • 5. Conclusion
  • Appendix