Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 26 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Phân tích cấu trúc hình học trang ảnh tài liệu dựa trên phương pháp ngưỡng thích nghi

Tác giả: Hà Đại Tôn

Lĩnh vực: Toán học

Nội dung tài liệu:

Luận án này tập trung nghiên cứu bài toán phân tích trang ảnh tài liệu, một lĩnh vực quan trọng trong nhận dạng văn bản. Nhận dạng văn bản bao gồm các bước tiền xử lý, phân tích trang, nhận dạng và hậu xử lý. Trong đó, phân tích trang là một bước thách thức lớn, liên quan đến việc xác định cấu trúc hình học và logic của trang ảnh.

Luận án đề xuất các giải pháp nhằm khắc phục các lỗi phổ biến trong phân tích trang như over-segmentation (chia quá nhỏ) và under-segmentation (gộp quá lớn). Cụ thể, luận án tập trung vào phân tích các vùng chữ trên trang ảnh sử dụng ngôn ngữ Latin, không bao gồm phân tích vùng bảng, ảnh hay cấu trúc logic.

Các kết quả đạt được bao gồm:

  • Giải pháp tăng tốc thuật toán phát hiện nền trang ảnh.
  • Phương pháp tham số thích nghi giúp giảm ảnh hưởng của kích cỡ và kiểu phông chữ.
  • Giải pháp phát hiện và sử dụng đối tượng phân tách trong thuật toán phân tích trang.
  • Giải pháp mới tách vùng chữ thành đoạn văn bản dựa trên phân tích ngữ cảnh.

Luận án giới thiệu các hướng tiếp cận chính cho bài toán phân tích trang: từ trên xuống (top-down), từ dưới lên (bottom-up) và lai ghép (hybrid). Hướng tiếp cận lai ghép được nhấn mạnh do khả năng khắc phục nhược điểm của hai hướng còn lại.

Bên cạnh đó, luận án còn đề cập đến các thuật toán phát hiện nền trang ảnh như WhiteSpace và thuật toán cải tiến Fast-WhiteSpace Detection, nhằm tăng tốc độ xử lý mà vẫn đảm bảo độ chính xác.

Cuối cùng, luận án trình bày hai thuật toán phân tích trang ảnh tài liệu là HP2S và AOSM, đều thuộc hướng tiếp cận lai ghép, với các phương pháp gom cụm và phân tách vùng chữ khác nhau.

Mục lục chi tiết: