Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 29 trang
Dung lượng: 282 KB

Giới thiệu nội dung

Phân Giải Nhập Nhằng Thực Thể Có Tên

Lĩnh vực: Xử lý ngôn ngữ tự nhiên, Trí tuệ nhân tạo

Nội dung tài liệu:

Luận án này đề xuất một phương pháp luận mới nhằm giải quyết bài toán phân giải nhập nhằng thực thể có tên (Named Entity Disambiguation – NED). Phương pháp này dựa trên ý tưởng khai thác các thực thể đã được xác định để cải thiện dần việc phân giải cho các trường hợp còn lại thông qua một quy trình lặp. Luận án tập trung nghiên cứu ba yếu tố chính ảnh hưởng đến hiệu quả phân giải: nguồn tri thức sử dụng (ontology đóng và Wikipedia), đặc trưng biểu diễn thực thể (tên đồng xuất hiện, định danh, từ ngữ xung quanh), và mô hình phân giải nhập nhằng. Cụ thể, luận án đề xuất ba mô hình chính: dựa trên heuristic, dựa trên thống kê, và mô hình lai kết hợp cả hai phương pháp này. Các đóng góp chính bao gồm việc đề xuất phương pháp luận phân giải nhập nhằng lặp cải thiện dần, các phương pháp phân hạng ứng viên dựa trên ontology và thống kê, cũng như các độ đo mới để đánh giá hiệu quả phân giải nhập nhằng.

Mục lục chi tiết:

  • Chương 1: Giới Thiệu
  • Chương 2: Nền Tảng Kiến Thức
  • Chương 3: Phân Giải Nhập Nhằng Dựa Trên Ontology
  • Chương 4: Phân Giải Nhập Nhằng Dựa Trên Ontology Được Làm Giàu
  • Chương 5: Phân Giải Nhập Nhằng Dựa Trên Wikipedia
  • Chương 6: Kết Luận