Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 11 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Speech Enhancement with Natural Sounding Residual Noise Based on Connected Time-Frequency Speech Presence Regions


Tác giả:

Karsten Vandborg Sørensen, Søren Vang Andersen


Lĩnh vực:

Communication Technology


Nội dung tài liệu:

Bài báo này trình bày các phương pháp miền thời gian-tần số cho ước lượng nhiễu và tăng cường âm thanh. Một phương pháp phát hiện sự hiện diện của giọng nói được sử dụng để xác định các vùng kết nối theo thời gian-tần số của sự hiện diện giọng nói. Các vùng này được sử dụng bởi một phương pháp ước lượng nhiễu, và cả quyết định về sự hiện diện giọng nói cùng với ước lượng nhiễu được sử dụng trong phương pháp tăng cường âm thanh. Các quy tắc suy giảm khác nhau được áp dụng cho các vùng có và không có sự hiện diện giọng nói để đạt được âm thanh được tăng cường với nhiễu nền được suy giảm có âm thanh tự nhiên. Phương pháp tăng cường âm thanh được đề xuất có độ phức tạp tính toán thấp, giúp nó khả thi cho các ứng dụng trong máy trợ thính. Một bài kiểm tra nghe không chính thức cho thấy phương pháp tăng cường âm thanh được đề xuất có điểm số ý kiến trung bình cao hơn đáng kể so với phương pháp tối thiểu sai số trung bình bình phương biên độ phổ logarit (MMSE-LSA) và MMSE-LSA theo hướng quyết định.


Mục lục chi tiết:

  • Introduction
  • Structure of the Algorithm
  • Spectral-Temporal Periodogram Smoothing
  • Connected Speech Presence Regions
  • Noise Estimation
  • Speech Enhancement
  • Experimental Setup
  • Experimental Results
  • Discussion