Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 71 trang
Dung lượng: 967 KB

Giới thiệu nội dung

Nghiên cứu mô hình ngôn ngữ N-gram và ứng dụng trong bài toán thêm dấu cho tiếng Việt không dấu

Tác giả: Cao Đức Tư

Lĩnh vực: Khoa học Máy tính

Nội dung tài liệu: Luận văn này tập trung vào việc nghiên cứu mô hình ngôn ngữ N-gram và các kỹ thuật liên quan đến việc làm trơn hóa phân bố xác suất của mô hình. Mục tiêu là nâng cao chất lượng ước lượng giá trị xác suất của mô hình. Nghiên cứu này còn hướng tới việc ứng dụng cụ thể mô hình N-gram cho tiếng Việt, đặc biệt là bài toán thêm dấu cho văn bản tiếng Việt không dấu. Dấu là thành phần quan trọng trong tiếng Việt, giúp truyền tải thông tin và ngữ nghĩa. Việc xử lý văn bản không dấu đặt ra thách thức cho các hệ thống xử lý ngôn ngữ tự nhiên. Đề tài sẽ sử dụng mô hình ngôn ngữ N-gram để tính toán khả năng thêm dấu với xác suất cao nhất, nhằm tự động hóa quá trình này.

Mục lục chi tiết:

  • Chương 1: Giới thiệu chung
  • Chương 2: Mô hình ngôn ngữ N-gram
  • Chương 3: Xây dựng N-gram cho tiếng Việt
  • Chương 4: Ứng dụng N-gram trong bài toán thêm dấu tiếng Việt
  • Chương 5: Kết luận và hướng phát triển của đề tài
  • Tài liệu tham khảo