Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 129 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Khai phá tri thức song ngữ và ứng dụng trong dịch máy Anh – Việt

Tác giả: Lê Quang Hùng

Lĩnh vực: Khoa học Máy tính

Nội dung tài liệu:

Luận án này tập trung vào việc phát triển các phương pháp nhằm giải quyết các vấn đề tồn tại trong dịch máy thống kê, đặc biệt là với cặp ngôn ngữ Anh – Việt. Các nhiệm vụ chính bao gồm: đề xuất phương pháp xây dựng ngữ liệu song ngữ, cải tiến các phương pháp gióng hàng từ, và xác định cụm từ song ngữ. Nghiên cứu khai thác dữ liệu từ nguồn Web và sách điện tử để xây dựng ngữ liệu song ngữ, đề xuất các phương pháp đặc trưng dựa trên nội dung và cấu trúc. Đồng thời, luận án cải tiến mô hình gióng hàng IBM 1 bằng cách tích hợp các ràng buộc như neo, vị trí, từ loại và cụm từ để nâng cao chất lượng dịch. Cuối cùng, phương pháp xác định cụm từ song ngữ dựa trên mẫu cú pháp và gióng hàng cụm từ được đề xuất và ứng dụng để cải thiện hệ thống dịch máy thống kê Anh – Việt.

Mục lục chi tiết:

  • Lời cam đoan
  • Tóm tắt
  • Lời cảm ơn
  • Danh mục các chữ viết tắt
  • Danh mục các hình vẽ
  • Danh mục các bảng
  • Mở đầu
  • Chương 1: Tổng quan (Khai phá tri thức song ngữ, sơ lược về dịch máy, dịch máy thống kê)
  • Chương 2: Xây dựng ngữ liệu song ngữ cho dịch máy thống kê
  • Chương 3: Gióng hàng từ cho dịch máy thống kê
  • Chương 4: Xác định cụm từ song ngữ cho dịch máy thống kê
  • Kết luận
  • Danh mục công trình khoa học của tác giả liên quan đến luận án
  • Tài liệu tham khảo