Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 76 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Tìm hiểu phương pháp đánh giá độ chính xác của các hệ thống nhận dạng chữ viết

Tác giả: Ngô Minh Hiếu

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:
Luận văn này tập trung vào việc tìm hiểu và đánh giá phương pháp xác định độ chính xác của các hệ thống nhận dạng chữ viết. Nghiên cứu đi sâu vào các khía cạnh tổng quan của bài toán nhận dạng chữ, bao gồm quy trình chung, các yếu tố ảnh hưởng đến chất lượng nhận dạng, cũng như khảo sát một số phần mềm nhận dạng chữ phổ biến trên thị trường như VnDOCR, FineReader, Omnipage, VietOCR. Luận văn cũng đề xuất xây dựng bộ công cụ và cơ sở dữ liệu mẫu chuẩn để phục vụ cho việc thử nghiệm và đánh giá hiệu quả của các thuật toán nhận dạng chữ Việt, nhằm mục tiêu nâng cao chất lượng nhận dạng.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Hình vẽ
  • Bảng
  • Danh mục các từ viết tắt
  • Mở đầu
  • Chương 1: Tổng quan về nhận dạng chữ
    • 1.1. Qui trình chung của một hệ nhận dạng chữ
      • 1.1.1. Phân lớp mẫu
      • 1.1.2. Nhận dạng văn bản
    • 1.2. Tìm hiểu một số phần mềm nhận dạng chữ
      • 1.2.1. VnDOCR
      • 1.2.2. FineReader
      • 1.2.3. OmniPage
      • 1.2.4. VietOCR
    • 1.3. Những vấn đề ảnh hưởng tới chất lượng của một phần mềm nhận dạng
      • 1.3.1. Chữ bị dính, nhòe
      • 1.3.2. Văn bản bị đứt hoặc mất nét
      • 1.3.3. Văn bản bị nhiễu
      • 1.3.4. Văn bản được in với các kiểu font chữ đặc biệt
      • 1.3.5. Cỡ chữ quá lớn hoặc quá nhỏ
    • 1.4. Kết luận
  • Chương 2: Phương pháp đánh giá hiệu quả của các thuật toán nhận dạng chữ Việt
    • 2.1. Một số khái niệm
    • 2.2. Bài toán hiệu chỉnh chuỗi ký tự (string editing)
    • 2.3. Thuật toán Ukkonen
    • 2.4. Đánh giá độ chính xác mức ký tự
    • 2.5. Đánh giá độ chính xác mức ký tự theo lớp mẫu
    • 2.6. Hiệu quả của các ký tự đánh dấu
    • 2.7. Độ chính xác mức từ
  • Chương 3: Thực nghiệm và đánh giá kết quả
    • 3.1. Phân tích, cài đặt chương trình
      • 3.1.1. Quy trình thực hiện
      • 3.1.2. Các cấu trúc dữ liệu
      • 3.1.3. Danh sách các từ dừng trong tiếng Việt
      • 3.1.4. Danh sách các ký tự đặc biệt
      • 3.1.5. Module đánh giá độ chính xác mức ký tự
      • 3.1.6. Module đánh giá độ chính xác mức từ
    • 3.2. Đánh giá thực nghiệm
      • 3.2.1. Dữ liệu thực nghiệm
      • 3.2.2. Kết quả thực nghiệm
    • 3.3. Kết luận chương 3
  • Kết luận
  • Danh mục tài liệu tham khảo