Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 168 trang
Dung lượng: 2 MB

Giới thiệu nội dung

Nghiên Cứu, Phát Triển Các Kỹ Thuật Tự Động Tóm Tắt Văn Bản Tiếng Việt

Tác giả: Nguyễn Nhật An

Lĩnh vực: Toán học

Nội dung tài liệu:

Luận án tiến sĩ này tập trung vào việc nghiên cứu và phát triển các kỹ thuật tự động tóm tắt văn bản tiếng Việt. Nghiên cứu đề cập đến tầm quan trọng của việc tóm tắt văn bản trong bối cảnh lượng thông tin khổng lồ trên Internet, nhằm cải thiện hiệu quả tìm kiếm và xử lý thông tin. Luận án phân tích hai hướng tiếp cận chính là tóm tắt trích rút (ES) và tóm tắt tóm lược (AS), đồng thời đánh giá hiện trạng nghiên cứu về tóm tắt văn bản tiếng Việt, so sánh với các ngôn ngữ khác.

Nghiên cứu đề xuất các phương pháp mới để nâng cao độ chính xác trong bài toán tóm tắt đơn văn bản tiếng Việt theo hướng trích rút. Cụ thể, luận án tập trung vào việc xác định các đặc trưng quan trọng của văn bản tiếng Việt và đề xuất hai phương pháp: phương pháp dựa trên bộ hệ số đặc trưng được xác định bằng học máy và giải thuật tối ưu phỏng sinh học; và phương pháp sử dụng kỹ thuật Voting (bầu chọn) có hệ số phương pháp được xác định thông qua học văn bản tóm tắt mẫu.

Mục lục chi tiết:

  • DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT
  • DANH MỤC CÁC BẢNG
  • DANH MỤC CÁC HÌNH VẼ, THUẬT TOÁN
  • MỞ ĐẦU
  • CHƯƠNG 1. TỔNG QUAN VỀ TÓM TẮT VĂN BẢN VÀ TÓM TẮT VĂN BẢN TIẾNG VIỆT
  • CHƯƠNG 2. TÓM TẮT VĂN BẢN TIẾNG VIỆT DỰA TRÊN BỘ HỆ SỐ ĐẶC TRƯNG
  • CHƯƠNG 3. TÓM TẮT VĂN BẢN TIẾNG VIỆT SỬ DỤNG KỸ THUẬT VOTING
  • CHƯƠNG 4. QUY TRÌNH XÂY DỰNG KHO NGỮ LIỆU CÓ CHÚ GIẢI CHO BÀI TOÁN TÓM TẮT VĂN BẢN TIẾNG VIỆT
  • KẾT LUẬN
  • DANH MỤC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ
  • TÀI LIỆU THAM KHẢO
  • PHỤ LỤC