Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 58 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Rừng Ngẫu Nhiên Cải Tiến Cho Lựa Chọn Thuộc Tính Và Phân Loại Dữ Liệu Gen

Tác giả: Vũ Văn Luân

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Luận văn thạc sĩ này tập trung vào việc ứng dụng và cải tiến thuật toán Rừng Ngẫu Nhiên (Random Forest) cho bài toán lựa chọn thuộc tính và phân loại dữ liệu gen. Nghiên cứu đề xuất một phương pháp cải tiến thuật toán Rừng Ngẫu Nhiên Điều Hướng (GRRF) nhằm nâng cao hiệu quả phân loại dữ liệu gen. Đề tài đi sâu vào các khái niệm cơ bản về khai phá dữ liệu, các kỹ thuật lựa chọn thuộc tính, cũng như các thuật toán liên quan đến cây quyết định và Rừng Ngẫu Nhiên. Các thực nghiệm được thực hiện trên môi trường R để đánh giá hiệu quả của phương pháp đề xuất. Mục tiêu chính là tìm hiểu các thuật toán lựa chọn thuộc tính, đặc biệt là Rừng Ngẫu Nhiên có kiểm soát và Rừng Ngẫu Nhiên điều hướng, từ đó đưa ra cải tiến nhằm tăng cường hiệu quả của thuật toán Rừng Ngẫu Nhiên Điều Hướng.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các ký hiệu và chữ viết tắt
  • Danh mục các hình vẽ
  • Danh mục các bảng
  • Mở đầu
  • Chương 1: Giới thiệu về khai phá dữ liệu và lựa chọn thuộc tính
  • Chương 2: Cây quyết định và Rừng ngẫu nhiên
  • Chương 3: Rừng ngẫu nhiên cải tiến cho bài toán lựa chọn thuộc tính trong dữ liệu có số chiều cao
  • Chương 4: Thực nghiệm trên môi trường R và đánh giá kết quả
  • Kết luận và hướng phát triển