Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 53 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Điều khiển tắc nghẽn mạng Internet bằng Deep Reinforcement Learning

Tác giả: LÊ HUY

Lĩnh vực: HỆ THỐNG THÔNG TIN

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu về việc áp dụng phương pháp học tăng cường sâu (Deep Reinforcement Learning – DRL) để điều khiển tắc nghẽn mạng Internet. Tác giả phân tích các vấn đề hiện tại của việc điều khiển tắc nghẽn, bao gồm sự phức tạp của mạng lưới, hạn chế của các thuật toán truyền thống khi đối mặt với sự gia tăng lưu lượng và các ứng dụng đòi hỏi trải nghiệm người dùng cao. Luận văn đề xuất một giải pháp sử dụng học máy và học sâu để phát triển giao thức điều khiển tắc nghẽn, có khả năng thích ứng với môi trường mạng thay đổi ngẫu nhiên. Các chương của luận văn lần lượt giới thiệu tổng quan về mạng Internet, các cơ chế điều khiển tắc nghẽn, học tăng cường và học tăng cường sâu; các nghiên cứu liên quan đến phương pháp rule-based và ML-based; và cuối cùng là đề xuất giải pháp cùng đánh giá hiệu năng.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục bảng
  • Danh mục hình, đồ thị
  • Danh mục chữ viết tắt
  • Chương 1. Tổng quan
    • 1.1 Giao thức TCP/IP
    • 1.2 TCP và cơ chế điều khiển tắc nghẽn
      • 1.2.1 Quá trình slow-start và congestion avoidance
      • 1.2.2 Quá trình Fast-Retransmit
      • 1.2.3 Quá trình Fast-Recovery
    • 1.3 Học tăng cường
      • 1.3.1 Các khái niệm cơ bản
      • 1.3.2 Quy trình quyết định Markov (Markov Decision Process – MDP)
      • 1.3.3 Q-Learning
      • 1.3.4 Học tăng cường sâu (Deep Q – Learning)
  • Chương 2. Các nghiên cứu liên quan
    • 2.1 Kỹ thuật điều khiển tắc nghẽn dựa vào rule-based
      • 2.1.1 TCP Tahoe
      • 2.1.2 TCP Reno
      • 2.1.3 TCP New Reno
    • 2.2 Kỹ thuật điều khiển tắc nghẽn dựa vào ML
    • 2.3 DRL – PCC Aurora
  • Chương 3. Đề xuất giải pháp
    • 3.1 Đề xuất cải tiến
    • 3.2 Xây dựng mô hình
    • 3.3 Đánh giá mô hình đề xuất
      • 3.3.1 Đánh giá huấn luyện
      • 3.3.2 Đánh giá sự thích ứng và độ ổn định
    • 3.4 Cài đặt thực nghiệm (Testbed) và kết quả
    • 3.5 Đánh giá kết quả thực nghiệm
  • Kết luận
  • Tài liệu tham khảo