Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 62 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

NHẬN DẠNG ĐỐI TƯỢNG ĐỒ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP

Tác giả: Nguyễn Tuấn Anh

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn tập trung giải quyết bài toán nhận dạng đối tượng đồ họa (như bảng biểu, đồ thị) trong ảnh văn bản, một vấn đề ngày càng trở nên phức tạp do sự gia tăng của các tài liệu số hóa. Các phương pháp hiện tại thường yêu cầu bộ dữ liệu huấn luyện đầy đủ về vị trí và nhãn của đối tượng, điều này tốn nhiều công sức và thời gian gán nhãn. Để khắc phục hạn chế này, luận văn đề xuất một phương pháp có thể tận dụng bộ dữ liệu không đầy đủ về nhãn. Các đóng góp chính bao gồm việc sử dụng mạng tích chập YOLO để định vị đối tượng đồ họa chỉ với dữ liệu về hộp giới hạn, và mạng học sâu tự giám sát DINO để trích xuất thuộc tính hình ảnh cho việc phân loại đối tượng với bộ dữ liệu có số lượng ảnh hạn chế. Cuối cùng, một hệ thống tìm kiếm và truy xuất đối tượng đồ họa trong ảnh văn bản đã được xây dựng và thử nghiệm, đạt kết quả nhận dạng xấp xỉ 74% và độ hồi tưởng 93.3% cho việc truy xuất văn bản.

Mục lục chi tiết:

  • Chương 1: Giới thiệu
  • Chương 2: Các nghiên cứu liên quan
  • Chương 3: Phương pháp nhận dạng đối tượng đồ họa trong ảnh văn bản
  • Chương 4: Thực nghiệm và kết quả
  • Chương 5: Kết luận