Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 65 trang
Dung lượng: 762 KB

Giới thiệu nội dung

Nghiên cứu phân lớp trên dữ liệu mất cân bằng và ứng dụng

Tác giả: NGUYỄN MINH HÀ

Lĩnh vực: Khoa học Máy tính

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu bài toán phân lớp dữ liệu, đặc biệt là trên các tập dữ liệu mất cân bằng. Vấn đề dữ liệu mất cân bằng là một thách thức lớn trong nhiều lĩnh vực ứng dụng thực tế, do nó ảnh hưởng đến hiệu quả và độ chính xác của các thuật toán học máy chuẩn. Luận văn đi sâu vào khảo sát các khái niệm cơ bản về phân lớp dữ liệu, các phương pháp đánh giá mô hình, và trình bày một số thuật toán phân lớp dữ liệu mất cân bằng. Cuối cùng, luận văn thực hiện thử nghiệm và đánh giá hiệu quả của các thuật toán đã nghiên cứu trên một bộ dữ liệu cụ thể.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các thuật ngữ viết tắt
  • Danh mục bảng
  • Danh mục hình
  • Mở đầu
  • Chương 1: Tổng quan về bài toán phân lớp dữ liệu trên các dữ liệu mất cân bằng
    • 1.1. Giới thiệu về bài toán phân lớp dữ liệu
      • 1.1.1. Khái niệm về phân lớp dữ liệu và bài toán phân lớp dữ liệu
      • 1.1.2. Quy trình thực hiện phân lớp dữ liệu
      • 1.1.3. Các độ đo đánh giá mô hình phân lớp dữ liệu
    • 1.2. Dữ liệu mất cân bằng
      • 1.2.1. Khái niệm về dữ liệu mất cân bằng
      • 1.2.2. Các đặc điểm phân lớp dữ liệu mất cân bằng
      • 1.2.3. Các ứng dụng của phân lớp dữ liệu mất cân bằng
    • 1.3. Tổng quan kỹ thuật xử lý dữ liệu mất cân bằng
      • 1.3.1. Hướng tiếp cận ở mức độ dữ liệu
      • 1.3.2. Hướng tiếp cận ở mức độ thuật toán
    • 1.4. Kết luận chương 1
  • Chương 2: Một số thuật toán phân lớp dữ liệu mất cân bằng
    • 2.1. Thuật toán DEC – SVM
      • 2.1.1. Giới thiệu thuật toán
      • 2.1.2. Khảo sát nội dung thuật toán
      • 2.1.3. Đánh giá thuật toán
    • 2.2. Thuật toán HMU
      • 2.2.1. Giới thiệu thuật toán
      • 2.2.2. Khảo sát nội dung thuật toán
      • 2.2.3. Đánh giá thuật toán
    • 2.3. Thuật toán HBU
      • 2.3.1. Giới thiệu thuật toán
      • 2.3.2. Khảo sát nội dung thuật toán
      • 2.3.3. Đánh giá thuật toán
    • 2.4. Thuật toán RBU
      • 2.4.1. Giới thiệu thuật toán
      • 2.4.2. Khảo sát nội dung thuật toán
      • 2.4.3. Đánh giá thuật toán
    • 2.5. Kết luận chương 2
  • Chương 3: Ứng dụng
    • 3.1. Khảo sát và lựa chọn bộ dữ liệu để thử nghiệm
      • 3.1.1. Giới thiệu
      • 3.1.2. Mô tả bộ dữ liệu Pima-indians-diabetes
    • 3.2. Xây dựng kịch bản và lựa chọn công cụ thử nghiệm
      • 3.2.1. Xây dựng kịch bản thử nghiệm
      • 3.2.2. Mô hình thử nghiệm
      • 3.2.3. Lựa chọn công cụ thử nghiệm
    • 3.3. Thử nghiệm và đánh giá kết quả thử nghiệm
      • 3.3.1. Mô tả thử nghiệm
      • 3.3.2. Kết quả thử nghiệm
      • 3.3.3. Đánh giá kết quả thử nghiệm
    • 3.4. Kết luận chương 3
  • Kết luận
  • Danh mục các tài liệu tham khảo