Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 193 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

NGHIÊN CỨU NÂNG CAO HIỆU QUẢ PHÂN TÍCH CÚ PHÁP TIẾNG VIỆT THEO TIẾP CẬN HỌC MÁY THỐNG KÊ

Tác giả: Nguyễn Thị Lương

Lĩnh vực: Toán học

Nội dung tài liệu:

Luận án này tập trung nghiên cứu nâng cao hiệu quả phân tích cú pháp tiếng Việt thông qua phương pháp học máy thống kê. Vấn đề phân tích cú pháp và gán nhãn vai nghĩa tiếng Việt còn nhiều thách thức do đặc thù ngôn ngữ đơn âm tiết, thiếu các kho ngữ liệu lớn và đa dạng. Luận án đề xuất các giải pháp để xây dựng bộ nhãn phụ thuộc, bộ nhãn vai nghĩa cho tiếng Việt, đồng thời xây dựng kho ngữ liệu lớn cho hai nhiệm vụ này. Các phương pháp học máy thống kê được áp dụng để cải thiện hiệu quả phân tích cú pháp thành phần, phân tích cú pháp phụ thuộc và gán nhãn vai nghĩa. Cụ thể, luận án nghiên cứu tích hợp biểu diễn phân bố từ vào các hệ thống phân tích cú pháp, đề xuất thuật toán rút trích thành phần và phương pháp quy hoạch tuyến tính nguyên để nâng cao hiệu quả gán nhãn vai nghĩa.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1: Cơ sở lý thuyết
  • Chương 2: Xây dựng kho ngữ liệu gán nhãn cú pháp phụ thuộc và vai nghĩa tiếng Việt
  • Chương 3: Nâng cao hiệu quả phân tích cú pháp tiếng Việt
  • Chương 4: Phương pháp quy hoạch tuyến tính nguyên gán nhãn vai nghĩa tiếng Việt
  • Kết luận
  • Các công trình công bố của luận án
  • Tài liệu tham khảo
  • Phụ lục