Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 30 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Phương Pháp Phân Cụm Dựa Trên Tập Thô Và Giải Thuật Di Truyền

Tác giả: Hoàng Huyền Trang

Lĩnh vực: Hệ thống thông tin

Nội dung tài liệu:

Luận văn trình bày khảo cứu một cách hệ thống các kiến thức về phân cụm dữ liệu rõ, thô theo hướng K-Means và ứng dụng giải thuật di truyền để phân cụm dữ liệu thô. Phương pháp phân cụm dữ liệu là một kỹ thuật quan trọng trong khai thác dữ liệu, nhằm phân loại các đối tượng không có nhãn thành nhiều cụm mà các đối tượng thuộc cùng một cụm thì tương tự nhau và khác nhau đối với các cụm khác nhau. Kỹ thuật K-Means được giới thiệu như một phương pháp phổ biến trong phân cụm dữ liệu, tuy nhiên, nhược điểm của nó là dễ rơi vào cực trị địa phương. Để khắc phục hạn chế này, luận văn đề xuất kết hợp K-Means với giải thuật di truyền, một thuật toán dựa trên nguyên tắc tiến hóa sinh học, nhằm tối ưu hóa toàn cầu và tránh tối ưu địa phương. Các chương của luận văn bao gồm: Phân cụm dữ liệu và các vấn đề liên quan; Phân cụm dựa trên tập thô và giải thuật di truyền; Cài đặt và phân tích thí nghiệm.

Mục lục chi tiết:

  • Chương I. Phân cụm dữ liệu và một số vấn đề liên quan.
  • Chương II. Phân cụm dựa trên tập thô và thuật toán di truyền.
  • Chương III. Cài đặt và phân tích thí nghiệm.