Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 27 trang
Dung lượng: 366 KB

Giới thiệu nội dung

Nghiên cứu thích ứng miền trong dịch máy thống kê Anh – Việt

Tác giả: Phạm Nghĩa Luân

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Luận án tiến sĩ này tập trung nghiên cứu về phương pháp thích ứng miền trong hệ thống dịch máy thống kê Anh-Việt. Nhận thấy nhu cầu ngày càng tăng về dịch thuật tự động chất lượng cao, luận án đề xuất các giải pháp nhằm nâng cao hiệu quả dịch máy, đặc biệt là với cặp ngôn ngữ Anh-Việt, một lĩnh vực còn nhiều thách thức do hạn chế về tài nguyên song ngữ và các nghiên cứu trước đây.

Nghiên cứu đi sâu vào hai hướng chính: (1) Tinh chỉnh bảng dịch cụm từ (phrase-table) dựa trên phân loại miền, nhằm điều chỉnh xác suất của các cụm từ để ưu tiên hơn trong miền đích, và (2) Phát triển phương pháp sinh tự động dữ liệu song ngữ bằng kỹ thuật dịch ngược, tận dụng nguồn dữ liệu đơn ngữ sẵn có. Luận án cũng đề xuất các phương pháp tiền xử lý để cải thiện chất lượng dữ liệu song ngữ được sinh ra, góp phần nâng cao hiệu quả của phương pháp sinh tự động.

Các phương pháp được trình bày và thực nghiệm trên các miền chung và miền pháp luật của cặp ngôn ngữ Anh-Việt, với mục tiêu cuối cùng là cải thiện chất lượng bản dịch máy.

Mục lục chi tiết:

  • Chương 1: Mở đầu
  • Chương 2: Kiến thức cơ sở (Tổng quan về dịch máy, Dịch máy thống kê, Dịch máy mạng nơ-ron, Đánh giá chất lượng dịch máy, Thích ứng miền trong dịch máy thống kê)
  • Chương 3: Phương pháp tinh chỉnh bảng dịch cụm từ (Giới thiệu, Các nghiên cứu liên quan, Phân loại văn bản, Phương pháp tinh chỉnh bảng dịch cụm từ)
  • Chương 4: Phương pháp sinh tự động dữ liệu song ngữ cho dịch máy (Giới thiệu, Phương pháp dịch ngược, Phương pháp đề xuất, Thực nghiệm)
  • Chương 5: Cải tiến chất lượng của phương pháp sinh tự động dữ liệu song ngữ (Giới thiệu, Phương pháp đề xuất, Thực nghiệm)
  • Chương 6: Kết luận và hướng phát triển
  • Danh mục công trình khoa học