Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 54 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Th UẬT TOÁN SELF-TRAINING VÀ CO-TRAINING ỨNG DỤNG TRONG PHÂN LỚP VĂN BẢN

Tác giả: Trần Thị Oanh

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Khóa luận này tập trung khảo sát hai thuật toán học bán giám sát điển hình là self-training và co-training. Nghiên cứu đề xuất các kỹ thuật làm trơn và ứng dụng chúng vào bài toán phân lớp văn bản. Các thuật toán này có khả năng tận dụng nguồn dữ liệu chưa gán nhãn phong phú, giúp giải quyết khó khăn trong việc thu thập dữ liệu huấn luyện có sẵn, vốn đòi hỏi nhiều thời gian và công sức.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1: Tổng quan về phân lớp văn bản và học bán giám sát
  • Chương 2: Thuật toán self-training và co-training
  • Chương 3: Thực nghiệm trong bài toán phân lớp văn bản
  • Kết luận và hướng phát triển
  • Tài liệu tham khảo