Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 80 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Một số thuật toán học máy trong phân loại hành vi sử dụng gói cước data viễn thông

Tác giả: Nguyễn Quang Tuấn

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu: Luận văn Thạc sĩ Kỹ thuật, theo định hướng ứng dụng, tập trung vào việc nghiên cứu, áp dụng các thuật toán học máy để phân loại hành vi sử dụng gói cước data viễn thông. Nghiên cứu bao gồm tổng quan về bài toán phân loại hành vi sử dụng dịch vụ viễn thông, các kỹ thuật xử lý dữ liệu lớn, các thuật toán học máy phổ biến như Rừng ngẫu nhiên, Naïve Bayes, Hồi quy Logistic, cùng với quy trình thực nghiệm và đánh giá hiệu năng của mô hình.

Mục lục chi tiết:

  • DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
  • DANH MỤC CÁC BẢNG
  • DANH MỤC CÁC HÌNH
  • MỞ ĐẦU
  • CHƯƠNG 1 – TỔNG QUAN VỀ BÀI TOÁN PHÂN LOẠI HÀNH VI SỬ DỤNG DỊCH VỤ VIỄN THÔNG
    • 1.1 Giới thiệu bài toán
    • 1.2 Tổng quan quy trình phân tích dữ liệu
      • 1.2.1 Tổng quan
      • 1.2.2 Quy trình triển khai bài toán phân tích dữ liệu
      • 1.2.3 Lưu đồ quy trình thực hiện dự án ứng dụng phân tích dữ liệu
    • 1.3 Xử lý dữ liệu phân tán với Spark
      • 1.3.1 Giới thiệu
      • 1.3.2 Cơ chế hoạt động
      • 1.3.3 Spark application
    • 1.4 Các chỉ số đánh giá hiệu năng mô hình
      • 1.4.1 Ma trận nhầm lẫn (Confusion matrix)
      • 1.4.2 Các chỉ số Accuracy, Precision, Recall và F1 score
      • 1.4.3 Đường cong ROC
      • 1.4.4 Biểu đồ Lift
      • 1.4.5 Biểu đồ Gain
    • 1.5 Các phương pháp xây dựng đặc trưng dữ liệu
      • 1.5.1 Các phương pháp thống kê lựa chọn đặc trưng dữ liệu với phương pháp lọc.
      • 1.5.2 Các phương pháp thống kê lựa chọn đặc trưng dữ liệu với phương pháp đóng gói…
      • 1.5.3 Các phương pháp thống kê lựa chọn đặc trưng dữ liệu với phương pháp nhúng
    • 1.6 Kỹ thuật tiền xử lý dữ liệu
      • 1.6.1 Xử lý thiếu giá trị
      • 1.6.2 Xử lý giá trị ngoại lai
    • 1.7 Thuật toán giảm chiều dữ liệu (PCA)
  • CHƯƠNG 2 – MÔ HÌNH HÀNH VI VÀ MỘT SỐ THUẬT TOÁN HỌC MÁY
    • 2.1 Thuật toán rừng ngẫu nhiên (Random Forest)
      • 2.1.1 Cây quyết định
      • 2.1.2 Thuật toán rừng ngẫu nhiên (Random Forest)
    • 2.2 Thuật toán Naïve Bayes
      • 2.2.1 Suy diễn Bayes
      • 2.2.2 Cơ sở lý thuyết
      • 2.2.3 Ứng dụng của Bayes trong phân tích dữ liệu
    • 2.3 Thuật toán Logistic Regression
      • 2.3.1 Khái niệm
      • 2.3.2 Cơ sở lý thuyết
  • CHƯƠNG 3 – THỬ NGHIỆM VÀ ĐÁNH GIÁ
    • 3.1 Đặt vấn đề
    • 3.2 Xác định bài toán
    • 3.3 Quy trình xây dựng mô hình học máy
    • 3.4 Thực nghiệm
      • 3.4.1 Nhập vào các thư viện
      • 3.4.2 Khai báo biến ngày tháng
      • 3.4.3 Import cơ sở dữ liệu
      • 3.4.4 Tiền xử lý dữ liệu
    • 3.5 Kết quả thực nghiệm
    • 3.6 Xây dựng hệ thống
      • 3.6.1 Giới thiệu hệ thống
      • 3.6.2 Biểu đồ ca sử dụng hành vi người dùng
      • 3.6.3 Biểu đồ ca sử dụng giám sát dự án
      • 3.6.4 Biểu đồ ca sử dụng giám sát mô hình
      • 3.6.5 Giao diện Home
      • 3.6.6 Giao diện thanh điều hướng
      • 3.6.7 Giao diện thông tin chung
      • 3.6.8 Giao diện nguồn dữ liệu
      • 3.6.9 Giao diện thông tin mô hình
    • 3.7 Kết quả trong triển khai thực tế
      • 3.7.1 Các chỉ số tính hiệu quả triển khai
      • 3.7.2 Kết quả triển khai thực tế
  • DANH MỤC TÀI LIỆU THAM KHẢO