Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 4 trang
Dung lượng: 133 KB

Giới thiệu nội dung

Demonstration Of Joshua: An Open Source Toolkit For Parsing-based Machine Translation

Tác giả: Zhifei Li, Chris Callison-Burch, Chris Dyer, Juri Ganitkevitch, Sanjeev Khudanpur, Lane Schwartz, Wren N. G. Thornton, Jonathan Weese, and Omar F. Zaidan

Lĩnh vực: Computational Linguistics and Information Processing, Human Language Technology and Pattern Recognition, Natural Language Processing

Nội dung tài liệu: Tài liệu này giới thiệu Joshua, một bộ công cụ mã nguồn mở dựa trên Java dành cho dịch máy thống kê dựa trên phân tích cú pháp. Joshua tích hợp các thuật toán cần thiết cho dịch thuật thông qua ngữ pháp tự do ngữ cảnh đồng bộ (SCFGs), bao gồm phân tích cú pháp biểu đồ, tích hợp mô hình ngôn ngữ n-gram, cắt tỉa và trích xuất k-best. Bộ công cụ này cũng triển khai trích xuất ngữ pháp mảng hậu tố và huấn luyện tỷ lệ lỗi tối thiểu. Để đảm bảo khả năng mở rộng, Joshua sử dụng các kỹ thuật tính toán song song và phân tán. Ngoài ra, tài liệu còn cung cấp một dàn ý trình diễn để minh họa các tính năng của bộ công cụ cho người dùng mới và người dùng có kinh nghiệm muốn mở rộng khả năng của nó.

Mục lục chi tiết:

  • Abstract
  • 1 Introduction
  • 2 Joshua Toolkit
    • Extensibility
    • End-to-end Cohesion
    • Scalability
  • 2.1 Joshua Toolkit Features
    • Training Corpus Sub-sampling
    • Suffix-array Grammar Extraction
    • Grammar formalism
    • Pruning
    • k-best extraction
    • Oracle Extraction
    • Parallel and distributed decoding
    • Language Models
    • Minimum Error Rate Training
    • Variational Decoding
  • 3 Demonstration Outline
  • 4 Demonstration Requirements
  • References