Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 27 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Similarity Evaluation In Vietnamese Textual Documents

Tác giả: HO PHAN HIEU

Lĩnh vực: COMPUTER SCIENCE

Nội dung tài liệu:

Luận văn này tập trung giải quyết bài toán đánh giá sự tương đồng trong các tài liệu văn bản tiếng Việt, với mục tiêu chính là phát hiện hiệu quả nội dung sao chép. Nghiên cứu đề xuất một phương pháp tiếp cận mới trong xử lý văn bản, ứng dụng các thành tựu từ xử lý tín hiệu số và sinh học để chuyển đổi văn bản thành chuỗi DNA. Dựa trên đó, các thuật toán so sánh và tìm kiếm trong thư viện dữ liệu lớn được phát triển để đánh giá mức độ tương đồng. Luận văn cũng trình bày các phương pháp biểu diễn văn bản dựa trên mô hình vector và các thuật toán tính toán sự tương đồng, bao gồm cả việc xem xét thứ tự từ để tăng độ chính xác của ngữ nghĩa.

Mục lục chi tiết:

  • Chương 1: Tổng quan về lĩnh vực nghiên cứu.
  • Chương 2: So sánh văn bản dựa trên mô hình vector.
  • Chương 3: Phát hiện sự tương đồng văn bản dựa trên Biến đổi Sóng Rời rạc (Discrete Wavelet Transform).
  • Chương 4: Phát triển hệ thống phát hiện sao chép cho tài liệu văn bản tiếng Việt.