Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 65 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Tóm Tắt Đa Văn Bản Dựa Vào Trích Xuất Câu

Tác giả: Trần Mai Vũ

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Luận văn này tập trung vào việc nghiên cứu và đề xuất phương pháp tóm tắt đa văn bản tiếng Việt dựa trên việc trích xuất câu. Bài toán tóm tắt đa văn bản được xác định là một thách thức lớn do sự phức tạp trong việc xử lý lượng lớn thông tin liên quan, cần loại bỏ trùng lặp và xác định thông tin quan trọng. Luận văn khảo sát các kỹ thuật tóm tắt đa văn bản, đặc biệt là phương pháp dựa trên trích xuất câu, nhằm xây dựng mô hình áp dụng cho ngôn ngữ tiếng Việt. Các phương pháp tiếp cận được phân tích dựa trên các mức độ sâu xử lý như hình thái, cú pháp và ngữ nghĩa.

Mục lục chi tiết:

  • Lời cảm ơn
  • Lời cam đoan
  • Mục lục
  • Danh sách hình vẽ
  • Danh sách bảng
  • Bảng từ viết tắt
  • Mở đầu
  • Chương 1: Khái quát bài toán tóm tắt văn bản
  • Chương 2: Tóm tắt đa văn bản dựa vào trích xuất câu
  • Chương 3: Độ tương đồng câu và các phương pháp tăng cường tính ngữ nghĩa cho độ tương đồng câu
  • Chương 4: Một số đề xuất tăng cường tính ngữ nghĩa cho độ tương đồng câu và áp dụng vào mô hình tóm tắt đa văn tiếng Việt
  • Chương 5: Thực nghiệm và đánh giá
  • Kết luận
  • Các công trình khoa học và sản phẩm đã công bố
  • Tài liệu tham khảo