Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 124 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Nghiên Cứu Phương Pháp Chuẩn Hoá Văn Bản Và Nhận Dạng Thực Thể Định Danh Trong Nhận Dạng Tiếng Nói Tiếng Việt

Tác giả: Nguyễn Thị Thu Hiền

Lĩnh vực: Máy Tính (Chuyên ngành: Hệ thống thông tin)

Nội dung tài liệu:

Luận án này tập trung nghiên cứu các phương pháp chuẩn hóa văn bản đầu ra của hệ thống nhận dạng tiếng nói (ASR) tiếng Việt, bao gồm việc khôi phục dấu câu và chữ hoa, nhằm cải thiện chất lượng xử lý. Đồng thời, luận án đề xuất và đánh giá các giải pháp cho bài toán nhận dạng thực thể định danh (NER) trên văn bản đầu ra của ASR tiếng Việt, sử dụng hai hướng tiếp cận: đường ống (Pipeline) và đầu cuối (End-to-End). Nghiên cứu cũng xây dựng các bộ dữ liệu văn bản kết hợp với tiếng nói để huấn luyện và đánh giá các mô hình, đồng thời đề xuất các mô hình cải tiến cho việc chuẩn hóa văn bản và nhận dạng thực thể định danh.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục từ viết tắt
  • Danh mục bảng biểu
  • Danh mục hình vẽ
  • Mở đầu
  • Chương 1: Tổng quan vấn đề nghiên cứu
  • Chương 2: Kiến thức cơ sở
  • Chương 3: Chuẩn hóa văn bản đầu ra của hệ thống nhận dạng tiếng nói tiếng Việt
  • Chương 4: Nhận dạng thực thể định danh cho văn bản đầu ra của hệ thống nhận dạng tiếng nói tiếng Việt
  • Kết luận
  • Danh mục công trình của tác giả
  • Tài liệu tham khảo