Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 62 trang
Dung lượng: 1 MB

Giới thiệu nội dung


XÂY DỰNG MÔ HÌNH NGÔN NGỮ VÀ SỬA LỖI TIẾNG BANA TỰ ĐỘNG

Tác giả: NGUYỄN ĐĂNG LINH

Lĩnh vực: HỆ THỐNG THÔNG TIN

Nội dung tài liệu:
Luận văn này tập trung vào việc xây dựng mô hình ngôn ngữ và cơ chế sửa lỗi chính tả tự động cho tiếng Ba Na. Nghiên cứu đề xuất sử dụng các phương pháp học sâu, cụ thể là mạng nơ-ron hồi quy (RNN) và bộ nhớ dài ngắn (LSTM), kết hợp với các mô hình ngôn ngữ ở mức ký tự (trái sang phải, phải sang trái và look-ahead) để đạt được độ chính xác cao trong việc xử lý và sửa lỗi tiếng Ba Na. Mục tiêu là tạo ra một hệ thống có khả năng hỗ trợ người dùng sửa lỗi tự động, góp phần bảo tồn và phát huy ngôn ngữ, văn hóa của dân tộc Ba Na.

Mục lục chi tiết:

  • LỜI CAM ĐOAN
  • LỜI CẢM ƠN
  • MỤC LỤC
  • DANH MỤC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
  • DANH MỤC HÌNH VẼ
  • DANH MỤC CÁC BẢNG, ĐỒ THỊ
  • CHƯƠNG 1 MỞ ĐẦU
    • 1.1 Lý do chọn đề tài
    • 1.2 Mục tiêu nghiên cứu
    • 1.3 Đối tượng, phạm vi nghiên cứu
    • 1.4 Phương pháp nghiên cứu
    • 1.5 Ý nghĩa khoa học và thực tiễn
    • 1.6 Bố cục luận văn
  • CHƯƠNG 2 TỔNG QUAN
    • 2.1 Công trình nghiên cứu có liên quan
    • 2.2 Người Ba Na
      • 2.2.1. Ngôn ngữ tiếng Ba Na
      • 2.2.2. Từ điển Ba Na Kriêm
      • 2.2.3. Bảng chữ cái và dấu tiếng Ba Na
      • 2.2.4. Một số quy luật của tiếng Ba Na
    • 2.3 Vấn đề chung còn tồn đọng
  • CHƯƠNG 3 CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP ĐỀ XUẤT
    • 3.1 Mô hình ngôn ngữ
    • 3.2 Kiến trúc RNN
    • 3.3 Kiến trúc LSTM
    • 3.4 Xây dựng tập dữ liệu tiếng Ba Na
      • 3.4.1. Thu thập dữ liệu văn bản
      • 3.4.2. Làm giàu dữ liệu
    • 3.5 Đặt bài toán cho mô hình ngôn ngữ tiếng Ba Na
    • 3.6 Đề xuất hướng giải quyết
    • 3.7 Các đặc trưng của mô hình đề xuất
      • 3.7.1. Xây dựng mô hình ngôn ngữ mức ký tự tiếng Ba Na left-to-right (Char L2R)
      • 3.7.2. Xây dựng mô hình ngôn ngữ mức ký tự tiếng Ba Na right-to-left (Char R2L)
      • 3.7.3. Xây dựng mô hình ngôn ngữ mức ký tự tiếng Ba Na Look-ahead
  • CHƯƠNG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ
    • 4.1 Tiêu chí đánh giá với độ đo WER
    • 4.2 Chuẩn bị dữ liệu
    • 4.3 Huấn luyện dữ liệu
    • 4.4 Kết quả thực nghiệm
      • 4.4.1. Kết quả mô hình ngôn ngữ mức ký tự tiếng Ba Na (Char L2R)
      • 4.4.2. Kết quả mô hình ngôn ngữ mức ký tự tiếng Ba Na (Char R2L)
      • 4.4.3. Kết quả sửa lỗi kết hợp 2 mô hình ngôn ngữ Char L2R và Char R2L
      • 4.4.4. Kết quả mô hình ngôn ngữ mức ký tự tiếng Ba Na Look-ahead
      • 4.4.5. Kết quả thực nghiệm kết hợp 3 mô hình ngôn ngữ Char L2R, Char R2L, Look-ahead với độ đo WER
  • CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
    • 5.1. Kết luận
    • 5.2. Hướng phát triển
  • TÀI LIỆU THAM KHẢO