Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 53 trang
Dung lượng: 938 KB

Giới thiệu nội dung

Sử dụng Active Learning trong việc lựa chọn dữ liệu gán nhãn cho bài toán Speech Recognition

Tác giả: Nguyễn Minh Sơn

Lĩnh vực: Khoa học Máy tính

Nội dung tài liệu:
Luận văn này tập trung vào việc nghiên cứu và ứng dụng phương pháp Học chủ động (Active Learning) nhằm tối ưu hóa quá trình lựa chọn dữ liệu gán nhãn cho bài toán Nhận dạng tiếng nói (Speech Recognition). Bài toán này đòi hỏi một lượng lớn dữ liệu được gán nhãn để đạt được độ chính xác cao, dẫn đến chi phí và thời gian đầu tư lớn. Luận văn đề xuất một phương pháp lựa chọn dữ liệu “quan trọng”, giúp giảm thiểu số lượng mẫu cần gán nhãn mà vẫn đảm bảo chất lượng dữ liệu huấn luyện, từ đó tiết kiệm ngân quỹ và nâng cao hiệu quả huấn luyện mô hình.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1. Giới thiệu bài toán
    • Tổng quan
    • Quy trình gán nhãn dữ liệu
    • Vấn đề chính trong một hệ thống gán nhãn dữ liệu
      • Các phương pháp lựa chọn dữ liệu gán nhãn
      • Đánh giá chất lượng gán nhãn
  • Chương 2. Mô hình nhận dạng tiếng nói
    • Giới thiệu
    • Kiến trúc mô hình nhận dạng tiếng nói
      • Đặc trưng âm học (Acoustic Front-end)
      • Mô hình âm học (Acoustic Model)
      • Mô hình ngôn ngữ (Language Model)
      • Bộ giải mã (Decoder)
    • Khảo sát mô hình nhận dạng tiếng nói hiện nay
      • Công cụ Kaldi
      • Deep Speech: Scaling up end-to-end speech recognition
      • Wav2letter++ Scaling Up Online Speech Recognition Using ConvNets
      • Mô hình QuartzNet: Deep Automatic Speech Recognition with 1D Time-Channel Separable Convolutions
      • PyChain: A Fully Parallelized PyTorch Implementation of LF-MMI for End-to-End ASR
      • Conformer: Convolution-augmented Transformer for Speech Recognition
  • Chương 3. Phương pháp học chủ động cho bài toán nhận dạng tiếng nói
    • Cơ sở lý thuyết [11]
      • Định nghĩa cụ thể của phương pháp học chủ động như sau
      • Ngữ cảnh chính của phương pháp học chủ động
      • Chiến lược truy vấn của phương pháp học chủ động
    • Một số áp dụng phương pháp học chủ động cho bài toán nhận dạng tiếng nói
      • Active Learning For Automatic Speech Recognition [13]
      • Active Learning for Speech Recognition: the Power of Gradients [14]
      • Active and Semi-Supervised Learning in ASR: Benefits on the Acoustic and Language Models [15]
  • Chương 4. Cài đặt thực nghiệm
  • Chương 5: Kết luận
  • TÀI LIỆU THAM KHẢO