Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 27 trang
Dung lượng: 408 KB

Giới thiệu nội dung

NGHIÊN CỨU ỨNG DỤNG LÝ THUYẾT TẬP THÔ TRONG TRÍCH CHỌN DỮ LIỆU

Tác giả: Vũ Thị Mai

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung vào việc nghiên cứu ứng dụng lý thuyết tập thô trong lĩnh vực khai phá dữ liệu, đặc biệt là trong bài toán trích chọn dữ liệu. Lý thuyết tập thô, được giới thiệu bởi Balan Zdzislak Pawlak, cung cấp một phương pháp tiếp cận mới để phân tích và trích xuất thông tin từ dữ liệu, đặc biệt là dữ liệu không chắc chắn và không chính xác. Luận văn trình bày tổng quan về khai phá dữ liệu và phát hiện tri thức, các phương pháp trích chọn dữ liệu phổ biến như cây quyết định, phân cụm, hồi quy, mạng nơron. Đi sâu vào lý thuyết tập thô, luận văn mô tả các khái niệm cơ bản như hệ thông tin, hệ quyết định, quan hệ tương đương, lớp tương đương, quan hệ bất khả phân, xấp xỉ tập hợp (bao gồm xấp xỉ dưới, xấp xỉ trên và biên), các loại tập thô, hệ số xấp xỉ, hàm thuộc thô. Cuối cùng, luận văn đề cập đến việc rút gọn thuộc tính thông qua khái niệm Reduct và hàm khả phân.

Mục lục chi tiết:

  • CHƯƠNG 1: CÁC PHƯƠNG PHÁP DÙNG TRONG TRÍCH CHỌN DỮ LIỆU
    • 1.1. Tổng quan về khai phá dữ liệu và phát hiện tri thức
      • 1.1.1. Khái niệm về phát hiện tri thức và khai phá dữ liệu
      • 1.1.2. Quá trình phát hiện tri thức
      • 1.1.3. Các nhiệm vụ của phát hiện tri thức và khai phá dữ liệu
      • 1.1.4. Các thách thức của phát hiện tri thức
    • 1.2. Các phương pháp trích chọn dữ liệu
      • 1.2.1. Cây quyết định
      • 1.2.2. Phân cụm (Clustering)
      • 1.2.3. Hồi quy (Regression)
      • 1.2.4. Mạng nơron (neural networks)
      • 1.2.5. Lý thuyết tập thô
  • CHƯƠNG 2: LÝ THUYẾT TẬP THÔ ỨNG DỤNG TRONG KHAI PHÁ DỮ LIỆU
    • 2.1. Các hệ thống thông tin
      • 2.1.1. Hệ thông tin
      • 2.1.2. Hệ quyết định
    • 2.2. Tính bất khả phân
      • 2.2.1. Quan hệ tương đương
      • 2.2.2. Lớp tương đương
      • 2.2.3. Quan hệ bất khả phân
    • 2.3. Xấp xỉ tập hợp
      • 2.3.1. Không gian xấp xỉ
      • 2.3.2. Tập xấp xỉ
      • 2.3.3. Tập thô
      • 2.3.4. Các tính chất trên tập xấp xỉ
      • 2.3.5. Các loại tập thô
    • 2.3.6. Hệ số xấp xỉ
    • 2.4. Hàm thuộc thô
    • 2.5. Tập thuộc tính thu gọn – Reduct
      • 2.5.1 Rút gọn các thuộc tính – Reduct
      • 2.5.2. Ma trận khả phân (ma trận phân biệt)
      • 2.5.3. Hàm khả phân (hàm phân biệt)
      • 2.5.4. Hàm k-khả phân
      • 2.5.5. k-Reduct