Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 12 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Accuracy of MFCC-Based Speaker Recognition in Series 60 Device

Tác giả:

Juhani Saastamoinen, Evgeny Karpov, Ville Hautamäki, Pasi Fränti

Lĩnh vực:

Computer Science, Speech Processing, Signal Processing

Nội dung tài liệu:

Bài báo này xem xét việc triển khai thực hiện nhận dạng giọng nói dựa trên hệ số cepstrum tần số Mel (MFCC) trên thiết bị Series 60 bằng phương pháp số nguyên (fixed point). Nghiên cứu phân tích sai số số học của MFCC và ảnh hưởng của nó đến độ chính xác nhận dạng. Các kỹ thuật giảm thiểu tổn thất thông tin trong việc chuyển đổi sang số nguyên cố định cũng được giới thiệu. Kết quả cho thấy sai số xử lý tín hiệu quan trọng hơn sai số trong thuật toán phân loại đối với độ chính xác nhận dạng giọng nói. Nghiên cứu cũng thảo luận về các yêu cầu lập trình cụ thể cho Symbian và Series 60.

Mục lục chi tiết:

1. INTRODUCTION
2. SPEAKER IDENTIFICATION SYSTEM
3. SYMBIAN ENVIRONMENT
3.1. Symbian OS and Series 60
4. NUMERICAL ANALYSIS OF MFCC AND VQ IN FIXED POINT ARITHMETIC
4.1. Preemphasis
4.2. Signal windowing
4.3. Fourier spectrum
4.3.1. Existing fixed point implementations
4.3.2. Proposed FFT
4.3.3. Bit allocation
4.3.4. Evaluation of the accuracy
4.4. Magnitude spectrum
4.4.1. Complex magnitude with fixed point numbers
4.5. Filter bank
4.6. Logarithm
4.7. Discrete cosine transformation
4.8. Model creation and recognition
5. SPEAKER RECOGNITION EXPERIMENTS
5.1. Simulations with PC
5.2. Mobile phone
6. CONCLUSION
7. ACKNOWLEDGMENTS