Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 11 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

A Computationally Efficient Mel-Filter Bank VAD Algorithm for Distributed Speech Recognition Systems

Tác giả: Damjan Vlaj, Bojan Kotnik, Bogomir Horvat, Zdravko Kačič

Lĩnh vực: EURASIP Journal on Applied Signal Processing

Nội dung tài liệu:

Bài báo này trình bày một thuật toán phát hiện hoạt động giọng nói (VAD) hiệu quả về mặt tính toán, dựa trên đầu ra của bộ lọc Mel-bank (MFB). Thuật toán này nhấn mạnh tầm quan trọng của các thuật toán VAD trong hệ thống nhận dạng giọng nói phân tán (DSR). Việc sử dụng thuật toán VAD hiệu quả giúp giảm dung lượng cần thiết của kênh truyền tín hiệu tiếng nói, cho phép chỉ truyền các phần chứa giọng nói. Thuật toán đề xuất sử dụng tiêu chí Hangover để đưa ra quyết định VAD, và đã được so sánh với ba thuật toán VAD khác được sử dụng trong các tiêu chuẩn G.729, G.723.1 và DSR (advanced front-end). Kết quả thử nghiệm trên cơ sở dữ liệu Aurora 2, với các tỷ lệ tín hiệu trên nhiễu (SNRs) khác nhau, cho thấy thuật toán MFB VAD mới vượt trội hơn hẳn các thuật toán tiêu chuẩn về hiệu suất nhận dạng giọng nói.

Mục lục chi tiết:

(Không có thông tin mục lục chi tiết trong tài liệu được cung cấp)