Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 50 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Nghiên cứu và phát triển các công cụ xử lý tiếng Việt trên UIMA

Tác giả: Nguyễn Đức Nam

Lĩnh vực: Công Nghệ Thông Tin

Nội dung tài liệu:

Khóa luận này tập trung vào việc nghiên cứu và phát triển các công cụ xử lý tiếng Việt trên nền tảng kiến trúc UIMA (Unstructured Information Management Architecture). UIMA là một kiến trúc quản lý thông tin phi cấu trúc, được phát triển để phân tích các nguồn thông tin không có cấu trúc và chuyển đổi chúng thành thông tin có cấu trúc mang giá trị cao. Công trình này tích hợp các công cụ xử lý tiếng Việt có sẵn, như tách từ và nhận dạng thực thể, lên kiến trúc UIMA nhằm xây dựng một hệ thống phân tích tiếng Việt hiệu quả. Khóa luận đi sâu vào giới thiệu kiến trúc UIMA, các nền tảng cơ bản để xây dựng ứng dụng, cách xây dựng và khai thác kết quả phân tích, cũng như trình bày chi tiết việc xây dựng công cụ phân tích tiếng Việt trên UIMA. Cuối cùng, khóa luận tổng kết kết quả đạt được và đề xuất các hướng phát triển trong tương lai.

Mục lục chi tiết:

  • Lời cảm ơn
  • Lời mở đầu
  • Mục lục
  • Danh sách hình vẽ
  • Danh sách thuật ngữ
  • Chương 1: Giới thiệu
  • Chương 2: Tổng quan kiến trúc xử lý thông tin phi cấu trúc (UIMA)
  • Chương 3: Xây dựng công cụ phân tích tiếng Việt trên UIMA
  • Chương 4: Tổng kết và hướng phát triển
  • Tài liệu tham khảo