Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 77 trang
Dung lượng: 4 MB

Giới thiệu nội dung

Nghiên cứu trích rút và chú thích ngữ nghĩa các thực thể có tên cho các kho ngữ liệu dùng trong lĩnh vực xử lý ngôn ngữ tự nhiên

Tác giả: KS. Trần Thu Thủy

Lĩnh vực: Xử lý ngôn ngữ tự nhiên

Nội dung tài liệu:

Đề tài tập trung vào việc nghiên cứu các kỹ thuật phân tách và trích rút danh từ riêng, đặc biệt là danh từ riêng chỉ người và nơi chốn. Mục tiêu chính là xây dựng công cụ hỗ trợ Web ngữ nghĩa, phát triển các máy tìm kiếm hướng thực thể, từ đó đơn giản hóa các bài toán như tóm tắt văn bản, trích chọn thông tin. Đề tài đề xuất sử dụng phương pháp Maximung Matching để thực hiện việc so khớp, trích rút thực thể, với ưu điểm là nhanh, đơn giản, hiệu quả và không yêu cầu quá trình huấn luyện. Kết quả nghiên cứu cho thấy thuật toán này đạt độ chính xác trên 90% khi từ điển đủ lớn.

Mục lục chi tiết:

  • MỞ ĐẦU
  • CHƯƠNG 1 TỔNG QUAN CƠ SỞ LÝ THUYẾT ĐỀ TÀI
  • CHƯƠNG 2 ĐỀ XUẤT GIẢI PHÁP TRÍCH RÚT PHÂN LOẠI THỰC THỂ DANH TỪ RIÊNG CHO KHO NGỮ LIỆU
  • CHƯƠNG 3 XÂY DỰNG CHƯƠNG TRÌNH DEMO VÀ ĐÁNH GIÁ KẾT QUẢ
  • KẾT LUẬN
  • TÀI LIỆU THAM KHẢO