Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 78 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Nghiên cứu một số thuật toán phân cụm, phân lớp dữ liệu và ứng dụng

Tác giả: Nguyễn Minh Tâm

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu: Luận văn Thạc sĩ Khoa học Máy tính này tập trung vào việc nghiên cứu các thuật toán phân cụm và phân lớp dữ liệu, là những kỹ thuật cơ bản trong khai phá dữ liệu. Tài liệu trình bày tổng quan về phát hiện tri thức và khai phá dữ liệu, đi sâu vào hai kỹ thuật chính là phân cụm và phân lớp dữ liệu cùng các thuật toán cơ bản liên quan. Ngoài ra, luận văn còn đề cập đến các ứng dụng thực tiễn và kết quả thử nghiệm sử dụng phần mềm Weka. Mục tiêu chính là tìm hiểu và ứng dụng các phương pháp để xử lý, phân tích lượng dữ liệu lớn ngày càng tăng trong nhiều lĩnh vực.

Mục lục chi tiết:

  • Lời cảm ơn
  • Lời cam đoan
  • Mở đầu
  • Chương 1: Tổng quan
    • 1.1 Giới thiệu chung
    • 1.2 Các bước trong khai phá dữ liệu
    • 1.3 Các kỹ thuật áp dụng trong khai phá dữ liệu
    • 1.4 Ứng dụng của khai phá dữ liệu
    • 1.5 Những thách thức trong khai phá dữ liệu
  • Chương 2: Phân cụm dữ liệu và một số thuật toán cơ bản
    • 2.1 Định nghĩa về phân cụm dữ liệu
    • 2.2 Mục tiêu của phân cụm dữ liệu
    • 2.3 Bài toán phân cụm dữ liệu
    • 2.4 Một số kiểu dữ liệu
    • 2.5 Một số kỹ thuật phân cụm dữ liệu
      • 2.5.1 Phương pháp phân cụm dữ liệu dựa trên phân cụm phân cấp
      • 2.5.2 Phương pháp phân cụm dữ liệu dựa trên mật độ
      • 2.5.3 Phương pháp phân cụm phân hoạch
    • 2.6 Kết luận
  • Chương 3: Phân lớp dữ liệu và một số thuật toán cơ bản
    • 3.1 Định nghĩa về phân lớp dữ liệu
    • 3.2 Các vấn đề quan tâm của phân lớp dữ liệu
      • 3.2.1 Quá trình phân lớp dữ liệu
      • 3.2.2 So sánh các phương pháp phân lớp
    • 3.3 Phân lớp bằng cây quyết định
      • 3.3.1 Khái niệm về cây quyết định
      • 3.3.2 Ưu, nhược điểm của cây quyết định
      • 3.3.3 Một số thuật toán của cây quyết định
    • 3.4 Phân lớp bằng Bayesian
    • 3.5 Phân lớp dựa trên sự kết hợp
      • 3.5.1 Các khái niệm quan trọng về luật kết hợp
      • 3.5.2 Một số thuật toán về luật kết hợp
    • 3.6 Độ chính xác classifier
    • 3.7 Kết luận
  • Chương 4: Một số kết quả thử nghiệm
    • 4.1 Giới thiệu về công cụ phân cụm, phân lớp dữ liệu Weka
    • 4.2 Ứng dụng phân cụm dữ liệu để phân nhóm khách hàng
    • 4.3 Ứng dụng phân lớp dữ liệu để phân lớp
      • 4.3.1 Phân lớp dữ liệu với thuật toán Apriori
      • 4.3.2 Phân lớp dữ liệu với thuật toán Naive Bayes
  • Kết luận
  • Tài liệu tham khảo