Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 73 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Gán nhãn ảnh tự động sử dụng kết hợp nhiều nguồn thông tin

Tác giả: Nguyễn Thị Dương

Lĩnh vực: Điện tử – Viễn thông

Nội dung tài liệu:

Luận văn này tập trung vào việc nghiên cứu và phát triển phương pháp gán nhãn ảnh tự động, kết hợp nhiều nguồn thông tin để nâng cao hiệu quả. Nghiên cứu khám phá việc sử dụng đa dạng các loại đặc trưng ảnh cấp thấp (low-level features) để biểu diễn và mô tả ảnh, bao gồm lược đồ màu (CH), đặc trưng tương quan màu (CORR), lược đồ hệ số góc (EDH), cấu trúc sóng con (WT), mô-men màu (CM55) và phương pháp túi từ điển (Bag of Word – BOW). Song song đó, luận văn cũng xem xét việc khai thác các nguồn thông tin phụ trợ như nhãn, chú giải (tags), bình luận của người dùng từ các nền tảng trực tuyến, nhằm bổ sung cho thông tin từ ảnh, từ đó cải thiện độ chính xác và hiệu quả của quá trình gán nhãn.

Luận văn tiến hành so sánh và đánh giá hiệu quả của các thuật toán phân loại phổ biến như K-NN (K-Nearest Neighbors) và SVM (Support Vector Machine) trong việc xử lý và gán nhãn ảnh. Các phương pháp được trình bày và thử nghiệm dựa trên tập dữ liệu NUS-WIDE, bao gồm phân tích các đặc trưng riêng biệt và sự kết hợp của chúng, cũng như việc tích hợp thông tin chú giải để tối ưu hóa quá trình gán nhãn.

Mục lục chi tiết:

  • PHẦN MỞ ĐẦU
  • Chương 1. TỔNG QUAN VỀ PHƯƠNG PHÁP GÁN NHÃN TỰ ĐỘNG CHO ẢNH
  • Chương 2. THUẬT TOÁN GÁN NHÃN ẢNH CHỈ SỬ DỤNG CÁC VECTOR ĐẶC TRƯNG
  • Chương 3: THUẬT TOÁN SỬ DỤNG KẾT HỢP THÔNG TIN PHỤ TRỢ
  • KẾT LUẬN
  • TÀI LIỆU THAM KHẢO
  • PHỤ LỤC