Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 118 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Xây dựng hệ thống tìm kiếm thông tin tiếng Việt dựa trên các chỉ mục là các từ ghép

Tác giả: Nguyễn Thị Thanh Hà – Nguyễn Trung Hiếu

Lĩnh vực: Công nghệ Thông tin

Nội dung tài liệu:

Luận văn này tập trung vào việc xây dựng một hệ thống tìm kiếm thông tin (search engine) có khả năng xử lý và hiểu các văn bản tiếng Việt. Khác với các hệ thống hiện có chủ yếu phục vụ các ngôn ngữ Châu Âu, nghiên cứu này đề xuất một phương pháp lập chỉ mục (indexing) phù hợp với đặc trưng ngôn ngữ tiếng Việt, cụ thể là sử dụng các từ và từ ghép làm chỉ mục. Quy trình bao gồm các bước phân tích văn bản, tách từ tự động, lập chỉ mục, và cuối cùng là so khớp, sắp xếp các tài liệu trả về dựa trên mức độ liên quan đến yêu cầu tìm kiếm. Luận văn cũng đi sâu vào các mô hình tìm kiếm khác nhau, như mô hình không gian vector, và trình bày kiến trúc, thiết kế chi tiết cho hệ thống.

Mục lục chi tiết:

  • Phần 1: Tìm hiểu lý thuyết
    • Chương 1: Tổng quan về tìm kiếm thông tin
    • Chương 2: Xây dựng một hệ thống tìm kiếm thông tin
  • Phần 2: Phân tích và thiết kế
    • Chương 3: Tách từ tự động
    • Chương 4: Lập chỉ mục
    • Chương 5: Phân tích
    • Chương 6: Thiết kế và cài đặt
  • Phần 3: Tổng kết