Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 158 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

NGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC MÁY CHO TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN

Tác giả: NGUYỄN THỊ THANH THỦY

Lĩnh vực: HỆ THỐNG THÔNG TIN

Nội dung tài liệu:

Luận án “Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản” tập trung vào việc giải quyết các thách thức trong lĩnh vực xử lý ngôn ngữ tự nhiên. Cụ thể, đề tài đề xuất các phương pháp học máy tiên tiến nhằm nâng cao hiệu quả trích xuất thông tin từ văn bản. Luận án xem xét hai nhóm phương pháp chính: phương pháp dựa trên luật và phương pháp dựa trên học máy, trong đó nhấn mạnh vào các kỹ thuật học máy. Một số vấn đề tồn tại trong các phương pháp học máy truyền thống đã được chỉ ra, bao gồm yêu cầu gán nhãn thủ công lượng lớn dữ liệu, chi phí thời gian, sự phụ thuộc vào miền lĩnh vực và ngôn ngữ, cũng như khó khăn trong việc trích chọn đặc trưng thủ công. Do đó, luận án tập trung nghiên cứu và đề xuất các phương pháp học máy để giải quyết các nhiệm vụ trích xuất thông tin, bao gồm trích xuất khía cạnh và phân loại quan điểm cho tiếng Việt bằng cách tận dụng dữ liệu đã gán nhãn từ ngôn ngữ khác, và trích xuất thực thể, quan hệ trong văn bản pháp quy tiếng Việt.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các bảng
  • Danh mục các hình vẽ
  • Danh mục các từ viết tắt
  • PHẦN MỞ ĐẦU
  • CHƯƠNG 1. TỔNG QUAN VỀ TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ VĂN BẢN
  • CHƯƠNG 2. TRÍCH XUẤT KHÍA CẠNH VÀ PHÂN LOẠI QUAN ĐIỂM CHO TIẾNG VIỆT TẬN DỤNG NGUỒN DỮ LIỆU ĐÃ ĐƯỢC GÁN NHÃN TỪ NGÔN NGỮ KHÁC
  • CHƯƠNG 3. TRÍCH XUẤT THỰC THỂ VÀ QUAN HỆ TRONG VĂN BẢN PHÁP QUY TIẾNG VIỆT SỬ DỤNG HỌC MÁY TRUYỀN THỐNG VÀ HỌC SÂU
  • CHƯƠNG 4. TRÍCH XUẤT KẾT HỢP ĐỒNG THỜI THỰC THỂ VÀ QUAN HỆ TRONG VĂN BẢN PHÁP QUY TIẾNG VIỆT SỬ DỤNG PHƯƠNG PHÁP HỌC SÂU
  • KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
  • DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ
  • TÀI LIỆU THAM KHẢO