Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 49 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng

Tác giả: Nguyễn Vũ Chi Loan

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Luận văn tập trung nghiên cứu về bài toán trích xuất từ khóa từ các trang web, một vấn đề quan trọng trong bối cảnh lượng thông tin trực tuyến ngày càng gia tăng. Các phương pháp trích xuất từ khóa tự động đã được đề xuất nhằm hỗ trợ các ứng dụng thực tế như tìm kiếm thông tin và tóm tắt văn bản. Nghiên cứu này tập trung vào phương pháp TextRank, đồng thời xem xét các phương pháp khác để nâng cao chất lượng từ khóa. Luận văn đã tiến hành áp dụng trên một số tập dữ liệu cụ thể từ các trang web tiếng Anh và thu được kết quả khả quan.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Tóm tắt nội dung
  • Bảng các ký hiệu và chữ viết tắt
  • Danh mục hình vẽ
  • Danh mục các bảng biểu
  • Mở đầu
  • Chương I: Giới thiệu bài toán trích rút từ khoá từ nội dung văn bản trên trang web
  • Chương 2: Các phương pháp trích rút từ khoá từ trang web
  • Chương 3: Kết quả thực nghiệm và đánh giá
  • Kết luận
  • Tài liệu tham khảo