Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 84 trang
Dung lượng: 778 KB

Giới thiệu nội dung

Tìm hiểu một số thuật toán khai phá tập mục lợi ích cao và ứng dụng

Tác giả: Vũ Anh Đức

Lĩnh vực: Khoa học máy tính, Khai phá dữ liệu

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu về bài toán khai phá tập mục lợi ích cao, một vấn đề quan trọng trong lĩnh vực khai phá dữ liệu. Bài toán này mở rộng từ bài toán khai phá tập mục phổ biến truyền thống, xem xét cả giá trị khách quan (ví dụ: số lượng bán) và giá trị chủ quan (lợi ích) của các mục dữ liệu. Mục tiêu là khám phá các tập mục mang lại lợi ích vượt trên một ngưỡng xác định. Luận văn giới thiệu tổng quan về khai phá dữ liệu, các kỹ thuật khai phá dữ liệu cơ bản, và đi sâu vào các thuật toán hiệu quả cho việc khai phá tập mục lợi ích cao như thuật toán Hai pha và HUI-Miner. Ngoài ra, luận văn còn đề cập đến việc xây dựng chương trình thực nghiệm và ứng dụng các thuật toán này vào bài toán thực tế là phát hiện nhóm mặt hàng mang lại lợi nhuận cao từ dữ liệu bán hàng.

Mục lục chi tiết:

  • MỤC LỤC
  • DANH MỤC HÌNH ẢNH
  • DANH MỤC BẢNG BIỂU
  • LỜI CẢM ƠN
  • LỜI CAM ĐOAN
  • LỜI MỞ ĐẦU
  • Chương I: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ KHAI PHÁ TẬP MỤC PHỔ BIẾN
    • 1.1 Khái niệm về khai phá tri thức và khai phá dữ liệu
    • 1.2 Quá trình khai phá dữ liệu
    • 1.3 Một số kỹ thuật khai phá dữ liệu
    • 1.4 Một số ứng dụng của khai phá dữ liệu
    • 1.5 Khai phá tập mục phổ biến
      • 1.5.1 CSDL giao tác
      • 1.5.2 Tập mục phổ biến và luật kết hợp
        • 1.5.2.1. Tập mục phổ biến
    • 1.6 Thuật toán khai phá tập mục phổ biến
      • 1.6.1 Thuật toán Apriori
      • 1.6.2 Thuật toán FP-growth
    • 1.7 Một số hướng mở rộng của bài toán khai phá tập mục phổ biến
  • Chương II: MỘT SỐ THUẬT TOÁN HIỆU QUẢ KHAI PHÁ TẬP MỤC LỢI ÍCH CAO
    • 2.1 Bài toán tập mục lợi ích cao
      • 2.1.1 Các khái niệm liên quan đến khai phá tập mục lợi ích cao
      • 2.1.2 Bài toán khai phá tập mục lợi ích cao
    • 2.2 Thuật toán Hai pha
      • 2.2.1 Cơ sở lý thuyết
      • 2.2.2 Các bước thực hiện của thuật toán Hai pha
    • 2.3 Thuật toán HUI – Miner
      • 2.3.1. Giới thiệu thuật toán
      • 2.3.2 Cấu trúc của utility-list
      • 2.3.3 Khai phá tập mục lợi ích cao
  • Chương III: CHƯƠNG TRÌNH THỰC NGHIỆM ỨNG DỤNG
    • 3.1 Bài toán phát hiện nhóm mặt hàng mang lại lợi nhuận cao trên tập dữ liệu bán hàng của siêu thị Yên Bái
    • 3.2 Mô tả dữ liệu
    • 3.3 Xây dựng chương trình
    • 3.4 Thực nghiệm khai phá tìm tập mục lợi ích cao
    • 3.5 Ý nghĩa của kết quả thực nghiệm
  • KẾT LUẬN
  • TÀI LIỆU THAM KHẢO
  • PHỤ LỤC