Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 57 trang
Dung lượng: 853 KB

Giới thiệu nội dung

Nông Tiến Công

Tác giả: Nông Tiến Công
Lĩnh vực: Khoa học máy tính
Nội dung tài liệu:

Luận văn này tập trung nghiên cứu về bài toán tóm tắt văn bản tiếng Việt dựa trên trích xuất câu. Tài liệu đề cập đến các khái niệm cơ bản về tóm tắt văn bản, các phương pháp phân loại, các phương pháp tiếp cận và các thuật ngữ liên quan. Đặc biệt, luận văn đi sâu vào phân tích các đặc điểm của ngôn ngữ tiếng Việt ảnh hưởng đến việc tóm tắt văn bản, bao gồm đặc điểm về từ vựng, ngữ pháp và chính tả. Bên cạnh đó, tài liệu còn trình bày các phương pháp đánh giá chất lượng của bản tóm tắt.

Mục lục chi tiết:

  • MỞ ĐẦU
  • Chương 1 TÓM TẮT VĂN BẢN TIẾNG VIỆT
    • 1.1. Bài toán tóm tắt văn bản
      • 1.1.1. Phân loại tóm tắt
      • 1.1.3. Mô hình tóm tắt văn bản và một số phương pháp tiếp cận
    • 1.2. Các phương pháp đánh giá
      • 1.2.1. Các phương pháp đánh giá trong
      • 1.2.2. Các phương pháp đánh giá ngoài
    • 1.3. Tóm tắt văn bản tiếng Việt dựa vào trích xuất câu và một số vấn đề liên quan
      • 1.3.1. Đặc điểm ngôn ngữ trong văn bản tiếng Việt
      • 1.3.3. Mô hình tóm tắt văn bản tiếng Việt dựa vào trích xuất câu
    • 1.4. Tổng kết chương
  • Chương 2 PHƯƠNG PHÁP TÓM TẮT VĂN BẢN DỰA TRÊN ĐỘ TƯƠNG ĐỒNG CÂU
    • 2.1. Một số khái niệm và phương pháp tính độ tương đồng câu
    • 2.2. Mô hình tóm tắt văn bản tiếng Việt dựa trên trích xuất câu quan trọng theo phương pháp tính độ tương đồng câu
    • 2.3. Tổng kết chương
  • Chương 3 THỰC NGHIỆM MÔ HÌNH TÓM TẮT VĂN BẢN TIẾNG VIỆT
    • 3.1. Môi trường thực nghiệm
    • 3.2. Chương trình tóm tắt văn bản
    • 3.3. Tiến hành thực nghiệm
      • 3.3.1. Cơ sở dữ liệu tổng thể
      • 3.3.2. Mô hình suy luận chủ đề ẩn
      • 3.3.3. Dữ liệu thực nghiệm
      • 3.3.4. Đánh giá độ chính xác của mô hình tóm tắt văn bản
    • 3.4. Tổng kết chương
  • KẾT LUẬN
  • TÀI LIỆU THAM KHẢO