Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 14 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

A Block-Based Linear MMSE Noise Reduction with a High Temporal Resolution Modeling of the Speech Excitation

Tên đề tài: A Block-Based Linear MMSE Noise Reduction with a High Temporal Resolution Modeling of the Speech Excitation

Tác giả: Chunjian Li, Søren Vang Andersen

Lĩnh vực: Xử lý tín hiệu số, Tăng cường tiếng nói, Giảm nhiễu

Nội dung tài liệu:

Nghiên cứu này trình bày một phương pháp LMMSE (Linear Minimum Mean Squared Error) tuyến tính dựa trên khối để nâng cao chất lượng tiếng nói với khả năng mô hình hóa độ phân giải thời gian cao cho tín hiệu kích thích. Phương pháp đề xuất nhằm mục tiêu ước lượng đồng thời phổ năng lượng và phổ pha của tín hiệu, đồng thời khai thác mối tương quan giữa các thành phần phổ. Một trong những nguyên nhân chính gây ra mối tương quan liên phổ này là sự tập trung năng lượng theo thời gian nổi bật trong tín hiệu kích thích của tiếng nói có thanh. Các bộ ước lượng LMMSE trong cả miền thời gian và miền tần số được hình thức hóa. Để đạt được bộ ước lượng kết hợp, ma trận hiệp phương sai của tín hiệu phổ được mô hình hóa như một ma trận hiệp phương sai đầy đủ, khác với ma trận hiệp phương sai đường chéo thường thấy trong bộ lọc Wiener dựa trên giả định bán tĩnh. Điều này được thực hiện bằng cách phân rã ma trận hiệp phương sai tín hiệu thành ma trận lọc tổng hợp và ma trận kích thích. Ma trận lọc tổng hợp được xây dựng từ các ước lượng hệ số mô hình dự đoán tuyến tính, và ma trận kích thích được xây dựng từ các ước lượng năng lượng tức thời của chuỗi phần dư. Phương pháp trừ phổ năng lượng theo định hướng quyết định và phương pháp mã hóa dự đoán tuyến tính đa xung sửa đổi (MPLPC) được sử dụng để thực hiện các ước lượng này. Công thức hóa theo miền phổ của bộ ước lượng LMMSE mang lại cái nhìn sâu sắc quan trọng về các mối tương quan liên phổ, được khai thác để giảm đáng kể độ phức tạp tính toán của bộ ước lượng. Đối với các ứng dụng hạn chế tài nguyên như máy trợ thính, sự cân bằng giữa hiệu suất và độ phức tạp có thể được điều chỉnh bằng cách thay đổi số lượng thành phần phổ được bao gồm trong ước lượng của mỗi thành phần. Các thử nghiệm cho thấy thuật toán đề xuất có khả năng giảm nhiễu nhiều hơn so với các phương pháp khác được chọn từ tình trạng hiện tại của công nghệ. Thuật toán đã cải thiện tỷ lệ SNR theo phân đoạn của tín hiệu nhiễu lên 13 dB trong trường hợp nhiễu trắng với SNR đầu vào là 0 dB.

Mục lục chi tiết:

  • 1. INTRODUCTION
  • 2. BACKGROUND
  • 3. HIGH TEMPORAL RESOLUTION MODELING FOR THE SIGNAL COVARIANCE MATRIX ESTIMATION
  • 4. THE ALGORITHM
  • 5. REDUCING COMPUTATIONAL COMPLEXITY
  • 6. RESULTS
  • 7. DISCUSSION