Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 11 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Data-Model Relationship in Text-Independent Speaker Recognition

Tác giả: John S. D. Mason, Nicholas W. D. Evans, Robert Stapert, Roland Auckenthaler

Lĩnh vực: Kỹ thuật Xử lý Tín hiệu Ứng dụng

Nội dung tài liệu:

Nghiên cứu này khám phá mối quan hệ giữa dữ liệu và mô hình trong nhận dạng người nói độc lập với văn bản. Các hệ thống nhận dạng người nói hiện đại, thường dựa trên mô hình hỗn hợp Gaussian (GMM), có thể được cải thiện bằng cách tích hợp thông tin trình tự thời gian (TSI). Bài báo giới thiệu Mô hình Hỗn hợp Phân đoạn (SMM), một phương pháp nhúng TSI vào mô hình GMM, mang lại hiệu suất nhận dạng người nói tốt hơn, đặc biệt khi có lượng lớn dữ liệu đào tạo. Nghiên cứu này cũng phân tích cách lượng dữ liệu đào tạo ảnh hưởng đến sự lựa chọn độ phức tạp của mô hình và đơn vị phân loại, cho thấy sự phát triển từ các đơn vị nguyên tử đến các đơn vị ngôn ngữ cao cấp hơn.

Mục lục chi tiết:

  • 1. Introduction
  • 2. Data-Model Relationship
  • 3. Harnessing TSI
  • 3.1. Implementation
  • 3.2. The GMM
  • 3.3. The SMM
  • 4. Experimental Work
  • 4.1. GMM versus SMM
  • 4.2. Data-model relationship
  • 5. Conclusions
  • REFERENCES