Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 67 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

NGHIÊN CỨU CÁC THUẬT TOÁN PHÂN LỚP DỮ LIỆU DỰA TRÊN CÂY QUYẾT ĐỊNH

Tác giả: Nguyễn Thị Thùy Linh

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Khóa luận này tập trung nghiên cứu về phân lớp dữ liệu, một hướng nghiên cứu chính của khai phá dữ liệu với nhiều ứng dụng trong các lĩnh vực khác nhau. Cây quyết định được xem là một công cụ mạnh mẽ và phổ biến cho việc phân lớp dữ liệu. Khóa luận tiến hành phân tích và đánh giá hai thuật toán tiêu biểu là C4.5 và SPRINT. Thuật toán C4.5 phù hợp với tập dữ liệu vừa và nhỏ, trong khi SPRINT được áp dụng cho các tập dữ liệu có kích thước cực lớn. Nghiên cứu bao gồm việc thực nghiệm với mô hình phân lớp C4.5 trên tập dữ liệu thực tế, đề xuất các cải tiến nhằm tăng hiệu năng và tiện ích cho người dùng, đồng thời tiến tới cài đặt SPRINT.

Mục lục chi tiết:

  • TÓM TẮT NỘI DUNG
  • LỜI CẢM ƠN
  • MỤC LỤC
  • DANH MỤC BIỂU ĐỒ HÌNH VẼ
  • DANH MỤC THUẬT NGỮ
  • ĐẶT VẤN ĐỀ
  • Chương 1. TỔNG QUAN VỀ PHÂN LỚP DỮ LIỆU DỰA TRÊN CÂY QUYẾT ĐỊNH
  • Chương 2. C4.5 VÀ SPRINT
  • Chương 3. CÁC KẾT QUẢ THỰC NGHIỆM
  • KẾT LUẬN
  • TÀI LIỆU THAM KHẢO