Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 67 trang
Dung lượng: 940 KB

Giới thiệu nội dung

Phân loại thư rác bằng phương pháp học máy

Tác giả: Phạm Thị Kim Dung

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung vào việc phân loại thư rác (spam) bằng các phương pháp học máy có giám sát. Nghiên cứu trình bày tổng quan về học máy và thư rác, bao gồm khái niệm, ứng dụng, các kỹ thuật học máy có giám sát như Naïve Bayes và Support Vector Machine (SVM). Luận văn cũng đi sâu vào phân tích đặc điểm của thư rác và cách biểu diễn chúng trong bài toán phân loại. Phần cuối luận văn trình bày quá trình cài đặt, thử nghiệm và đánh giá hiệu quả của các thuật toán đã chọn trong việc phân loại thư rác.

Mục lục chi tiết:

  • MỤC LỤC
  • LỜI CAM KẾT
  • LỜI CẢM ƠN
  • DANH MỤC CÁC TỪ VIẾT TẮT
  • DANH MỤC HÌNH VẼ VÀ BẢNG BIỂU
  • MỞ ĐẦU
  • CHƯƠNG 1. TỔNG QUAN VỀ HỌC MÁY VÀ THƯ RÁC
    • 1.1. Tổng quan về học máy
      • 1.1.1 Trí tuệ nhân tạo
      • 1.1.2. Học máy
      • 1.1.3. Các kĩ thuật học máy
        • 1.1.3.1. Học có giám sát
        • 1.1.3.2. Học không có giám sát
        • 1.1.3.3. Học nửa giám sát
        • 1.1.3.4. Học tăng cường
      • 1.1.4. Một số ứng dụng của học máy
      • 1.1.5. Học có giám sát
        • 1.1.5.1. Việc học
    • 1.2. Tổng quan về thư rác
      • 1.2.1. Định nghĩa về thư rác và các đặc trưng của thư rác
        • 1.2.1.1. Định nghĩa về thư rác
      • 1.2.2. Phân loại thư rác
      • 1.2.3. Đặc điểm thư rác
      • 1.2.4. Tác hại của thư rác
      • 1.2.5. Quy trình và thủ đoạn gửi thư rác
    • 1.3. Biểu diễn phân loại thư rác dựa trên học máy có giám sát
      • 1.3.1. Nhu cầu phân loại thư rác
      • 1.3.2. Cách biểu diễn nội dung thư rác
    • 1.4. Kết luận chương
  • CHƯƠNG 2. PHÂN LOẠI THƯ RÁC BẰNG MỘT SỐ THUẬT TOÁN HỌC MÁY CÓ GIÁM SÁT
    • 2.1. Thuật toán Naïve Bayes
      • 2.1.1.Giới thiệu Thuật toán Naïve Bayes
      • 2.1.2. Mô tả thuật toán
      • 2.1.3. Áp dụng trong phân loại thư rác
    • 2.2. Học máy theo phương pháp máy vec tơ tựa SVM
      • 2.2.1. Giới thiệu SVM
      • 2.2.2. Mô tả thuật toán
        • 2.2.2. Huấn luyện SVM
      • 2.2.3. Ứng dụng trong phân loại thư rác
    • 2.3. Xây dựng mô hình lọc thư rác dựa trên học máy có giám sát
      • 2.3.1. Lựa chọn mô hình và thuật toán
      • 2.3.2. Xây dựng hệ thống
    • 2.4. Kết luận chương
  • CHƯƠNG 3. CÀI ĐẶT THỬ NGHIỆM VIỆC PHÂN LOẠI THƯ RÁC
    • 3.1. Bài toán phân loại thư rác
    • 3.2. Cài đặt thử nghiệm và kết quả
      • 3.2.1. Bộ dữ liệu thử nghiệm
      • 3.2.2. Môi trường cài đặt
      • 3.2.3. Giao diện của chương trình thử nghiệm
      • 3.2.4. Kết quả thử nghiệm
    • 3.3. Đánh giá thử nghiệm
    • 3.4. Kết luận chương
  • KẾT LUẬN
    • Các kết quả đạt được
    • Hướng phát triển luận văn
  • DANH MỤC TÀI LIỆU THAM KHẢO