Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 8 trang
Dung lượng: 360 KB

Giới thiệu nội dung

Giải pháp giảm nhiễu trong miền Wavelet để nâng cao hiệu suất nhận dạng tiếng nói tự động

Tác giả: Phạm Văn Tuấn, Hoàng Lê Uyên Thục

Lĩnh vực: Khoa học và Công nghệ

Nội dung tài liệu: Bài báo trình bày nghiên cứu về phương pháp giảm nhiễu (NR) mới trong miền Wavelet. Bằng cách tích hợp thuật toán NR vào các khối front-ends trong hệ thống nhận dạng tiếng nói tự động (ASR), hiệu suất nhận dạng đã được cải thiện rõ rệt trong môi trường có nhiễu. Công nghệ xử lý tiếng nói hiện đại là chuyên ngành liên quan tới nhiều lĩnh vực, đòi hỏi các thuật toán phải có sự ổn định cao đối với môi trường nhiễu âm học. Nghiên cứu tập trung vào việc nâng cao hiệu suất cho hệ thống ASR trong môi trường có nhiễu, nơi tỷ lệ lỗi có thể tăng lên đáng kể khi tiếng nói bị méo đi nhiều do nhiễu mạnh.

Mục lục chi tiết:

  • Tóm tắt
  • Abstract
  • 1. Giới thiệu
  • 2. Giải thuật nén nhiễu trong miền Wavelet
    • 2.1. Mô hình nhiễu cộng
  • 2.2. Kỹ thuật chọn ngưỡng
  • 3. Hàm nén nhiễu thích nghi
  • 4. Đề xuất thuật toán giảm nhiễu mới
    • 4.1. Ánh xạ ngưỡng giác quan
    • 4.2. Kỹ thuật lọc percentile thích nghi
    • 4.3. Trọng số hóa trong miền thời gian và tần số
  • 5. Đánh giá kết quả thực nghiệm
  • 6. Kết luận
  • Tài liệu tham khảo