Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: DOCX
Số trang: 24 trang
Dung lượng: 819 KB

Giới thiệu nội dung

Nghiên Cứu Tóm Tắt Văn Bản Tự Động Và Ứng Dụng

Tác giả: NGUYỄN VIẾT HẠNH

Lĩnh vực: Công nghệ thông tin

Chuyên ngành: Kỹ thuật phần mềm

Mã số: 60480103

Nội dung tài liệu:

Nghiên cứu này tập trung vào bài toán tóm tắt văn bản tự động theo hướng tóm lược. Luận văn trình bày tổng quan về bài toán tóm tắt văn bản, các hướng tiếp cận khác nhau, lý thuyết về mạng nơ ron nhân tạo như ANN, RNN và LSTM. Đặc biệt, nghiên cứu tập trung vào việc xây dựng hệ thống tóm tắt văn bản bằng mô hình chuỗi sang chuỗi (sequence-to-sequence) sử dụng kiến trúc LSTM, kết hợp với các kỹ thuật word embedding và attention. Luận văn cũng trình bày quá trình xây dựng bộ dữ liệu cho tiếng Việt, thử nghiệm và đánh giá mô hình trên cả dữ liệu tiếng Anh và tiếng Việt bằng phương pháp ROUGE. Các kết quả thử nghiệm cho thấy tiềm năng của mô hình trong việc tạo ra các bản tóm tắt tự động chất lượng.

Mục lục chi tiết:

  • MỤC LỤC
  • DANH MỤC HÌNH VẼ
  • MỞ ĐẦU
  • CHƯƠNG 1: KHÁI QUÁT BÀI TOÁN TÓM TẮT VĂN BẢN
  • CHƯƠNG 2: MỘT SỐ NGHIÊN CỨU VỀ TÓM TẮT VĂN BẢN
  • CHƯƠNG 3: MẠNG NƠ RON NHÂN TẠO
  • CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TÓM TẮT VĂN BẢN THEO HƯỚNG TÓM LƯỢC
  • CHƯƠNG 5: THỬ NGHIỆM VÀ ĐÁNH GIÁ
  • KẾT LUẬN
  • TÀI LIỆU THAM KHẢO