Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 22 trang
Dung lượng: 429 KB

Giới thiệu nội dung

Nghiên cứu về dịch thống kê dựa vào cụm từ và thử nghiệm với cặp ngôn ngữ Anh – Việt

Tác giả: Đào Ngọc Tú

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn thạc sĩ này tập trung nghiên cứu về phương pháp dịch máy thống kê dựa trên cụm từ, một kỹ thuật tiên tiến trong lĩnh vực dịch tự động. Phương pháp này có ưu điểm vượt trội so với dịch máy thống kê dựa trên từ ở chỗ nó có thể xử lý các cụm từ thay vì từng từ riêng lẻ, giúp tránh được các vấn đề về đa nghĩa và cải thiện độ chính xác của bản dịch. Luận văn đi sâu vào phân tích kiến trúc, mô hình dịch và mô hình ngôn ngữ của hệ thống dịch máy thống kê dựa trên cụm từ, đồng thời đề xuất các phương pháp để tối ưu hóa quá trình này.

Đặc biệt, nghiên cứu tập trung vào việc áp dụng và thử nghiệm phương pháp này với cặp ngôn ngữ Anh – Việt, một cặp ngôn ngữ có ý nghĩa quan trọng trong bối cảnh hội nhập quốc tế hiện nay. Các thuật toán tìm kiếm như Beam search được đề cập, cùng với các phương pháp ước lượng xác suất cho bảng dịch cụm từ. Mục tiêu là xây dựng một hệ thống dịch máy hiệu quả, có khả năng xử lý tốt các văn bản song ngữ Anh – Việt.

Mục lục chi tiết:

  • Chương 1 – Tổng quan về dịch máy
  • Chương 2 – Mô hình dịch máy dựa trên cụm từ