Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 68 trang
Dung lượng: 2 MB

Giới thiệu nội dung

Phương pháp phân tích trang văn bản dựa trên Tab-Stop

Tác giả: Bùi Phương Thảo

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung vào phương pháp phân tích trang văn bản, một khâu quan trọng trong quá trình xử lý và nhận dạng tài liệu tự động. Nghiên cứu đề cập đến việc chuyển đổi tài liệu giấy sang định dạng điện tử, giải quyết những thách thức trong việc nhận dạng ký tự từ ảnh. Luận văn đi sâu vào phân tích cấu trúc vật lý và logic của tài liệu, giới thiệu các thuật toán tiền xử lý ảnh như lọc nhiễu, tách nền, xác định góc nghiêng. Đặc biệt, đề tài trình bày và áp dụng kỹ thuật phân tích trang văn bản dựa trên Tab-Stop, đồng thời so sánh với các hệ thống nhận dạng tài liệu hiện có như VnDOCR và OmniPage để đánh giá hiệu quả.

Mục lục chi tiết:

  • Chương 1: Nội dung trang văn bản và các phương pháp tiền xử lý
  • Chương 2: Phương pháp phân tích trang tài liệu
  • Chương 3: Kết quả nghiên cứu