Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 40 trang
Dung lượng: 688 KB

Giới thiệu nội dung

Nghiên cứu về thuật toán phân lớp sử dụng quá trình học máy bán giám sát, ứng dụng trong việc phân lớp trang Web

Tác giả: ThS. Lê Hoàng Dương, ThS. Ngô Quốc Vinh

Lĩnh vực: Công nghệ thông tin, Khai phá dữ liệu

Nội dung tài liệu:

Đề tài tập trung nghiên cứu về bài toán phân lớp dữ liệu, đặc biệt là việc áp dụng các thuật toán học máy bán giám sát trong lĩnh vực này. Với sự gia tăng nhanh chóng của khối lượng dữ liệu văn bản trên Internet, việc phân lớp dữ liệu hiệu quả trở nên vô cùng cấp thiết. Nghiên cứu đi sâu vào phân tích các phương pháp biểu diễn văn bản, cụ thể là sử dụng mô hình vector, và các thuật toán học máy như Support Vector Machine (SVM). Một phần quan trọng của đề tài là ứng dụng các phương pháp này vào việc phân lớp trang Web, nhằm nâng cao hiệu quả khai thác thông tin trên môi trường trực tuyến. Đề tài cũng đề cập đến các phương pháp đánh giá hiệu suất của mô hình phân lớp và các yếu tố ảnh hưởng đến quá trình này. Cuối cùng, kết quả nghiên cứu được trình bày dưới dạng báo cáo về thuật toán phân lớp sử dụng học máy bán giám sát và ứng dụng thực tiễn trong phân lớp trang Web.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1: Tổng quan về việc phân lớp sử dụng phương pháp học bán giám sát
  • Chương 2: Bài toán phân lớp áp dụng SVM và phương pháp học bán giám sát SVM
  • Chương 3: Kết quả thử nghiệm và đánh giá
  • Kết luận
  • Tài liệu tham khảo