Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 26 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Khai Phá Tri Thức Song Ngữ Và Ứng Dụng Trong Dịch Máy Anh – Việt

Tác giả: Lê Quang Hùng

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận án này tập trung vào việc khai thác tri thức song ngữ và ứng dụng của nó trong hệ thống dịch máy Anh-Việt. Nghiên cứu đề xuất các phương pháp nhằm bổ sung nguồn ngữ liệu cho dịch máy thống kê (SMT) và tăng cường chất lượng dịch dựa trên ngữ liệu hiện có. Cụ thể, luận án tập trung vào hai vấn đề chính: xây dựng ngữ liệu song ngữ từ các nguồn như Web và sách điện tử, và cải tiến các mô hình dịch máy thống kê. Các phương pháp được đề xuất bao gồm việc sử dụng cognate và phân đoạn văn bản để rút trích cặp câu song ngữ từ Web, cũng như áp dụng các mô hình gióng hàng từ và cụm từ để xây dựng ngữ liệu từ sách điện tử. Ngoài ra, luận án còn đề xuất các cải tiến cho mô hình gióng hàng IBM và phương pháp xác định cụm từ song ngữ để nâng cao chất lượng dịch.

Mục lục chi tiết:

  • Chương 1. Tổng quan
  • Chương 2. Xây dựng ngữ liệu song ngữ cho dịch máy thống kê
  • Chương 3. Nghiên cứu về một số cải tiến mô hình IBM để gióng hàng từ cho dịch máy thống kê (Chưa được trình bày chi tiết trong nội dung cung cấp)
  • Chương 4. Nghiên cứu về xác định cụm từ song ngữ cho dịch máy thống kê (Chưa được trình bày chi tiết trong nội dung cung cấp)