Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 78 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

PHÂN TÍCH CÚ PHÁP TIẾNG VIỆT THEO TIẾP CẬN THỐNG KÊ

Tác giả: Vương Hoài Thu

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Luận văn này tập trung vào việc xây dựng bộ phân tích cú pháp tiếng Việt dựa trên phương pháp thống kê. Nghiên cứu đề cập đến các cách tiếp cận và phương pháp cơ bản trong phân tích cú pháp, đặc biệt là tiếp cận thống kê và thông tin từ vựng. Luận văn sẽ phân tích và áp dụng bộ phân tích cú pháp của Bikel để xây dựng bộ phân tích cú pháp cho tiếng Việt. Cụ thể, luận văn sẽ nghiên cứu các phương pháp tiếp cận trong việc xây dựng bộ phân tích cú pháp, bao gồm cả phương pháp cổ điển như top-down và bottom-up, cũng như các hướng tiếp cận thống kê. Luận văn cũng sẽ giới thiệu về các kho ngữ liệu, bao gồm Penn Treebank (tiếng Anh) và Viet Treebank (tiếng Việt), là những thành phần quan trọng cho việc huấn luyện mô hình thống kê.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1: Giới thiệu
  • Chương 2: Phương pháp phân tích cú pháp
  • Chương 3: Tiếp cận trong xây dựng bộ phân tích cú pháp Tiếng Việt
  • Chương 4: Bộ phân tích cú pháp của Bikel
  • Chương 5: Áp dụng bộ phân tích cú pháp của Bikel và dữ liệu Viet Treebank
  • Kết luận
  • Tài liệu tham khảo