Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 69 trang
Dung lượng: 943 KB

Giới thiệu nội dung

Nghiên cứu Phát triển Nền Tảng Tích Hợp Phân Tích Dữ Liệu Dòng

Tác giả: Lê Dương Phong

Lĩnh vực: Học viện Công nghệ Bưu chính Viễn thông

Nội dung tài liệu:
Luận văn này tập trung vào việc nghiên cứu và phát triển một nền tảng tích hợp để phân tích dữ liệu dòng, đặc biệt là dữ liệu giám sát giao thông. Mục tiêu là xây dựng mô hình trực quan hóa dữ liệu, đo đếm lưu lượng phương tiện, nhận diện biển số xe và dự báo lưu lượng giao thông. Luận văn đề xuất giải pháp lưu trữ, xử lý và truy vấn dữ liệu hiệu quả cho hệ thống giám sát đô thị thông minh, đáp ứng nhu cầu xử lý khối lượng lớn dữ liệu đa định dạng và đa kích cỡ.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh sách hình vẽ
  • Danh sách bảng
  • Danh mục các thuật ngữ, chữ viết tắt
  • Mở đầu
  • Chương 1: Giới thiệu
    • 1.1. Tính cấp thiết của đề tài
    • 1.2. Mục tiêu và nhiệm vụ nghiên cứu
    • 1.3. Phạm vi nghiên cứu
    • 1.4. Kết cấu luận văn
  • Chương 2: Cơ sở lý thuyết
    • 2.1. Apache Kafka
      • 2.1.1. Giới thiệu về Kafka
      • 2.1.2. Một số thành phần quan trọng của Kafka
    • 2.2. Apache Spark
      • 2.2.1. Giới thiệu về Apache Spark
      • 2.2.2. Kiến trúc của Spark
    • 2.3. Tình hình nghiên cứu trong nước
    • 2.4. Cơ sở lý luận
    • 2.5. Lý thuyết về các kiến trúc và thuật ngữ
      • 2.5.1. Data Warehouse
      • 2.5.2. Data Lake
      • 2.5.3. Data Lakehouse
      • 2.5.4. Table Format
  • Chương 3: Bài toán và giải pháp cho hệ lưu trữ và truy vấn dữ liệu giao thông
    • 3.1. Mô tả bài toán
    • 3.2. Các vấn đề phân tích để giải quyết bài toán
      • 3.2.1. Phân tích đặc trưng dữ liệu thực tế
      • 3.2.2. Phân tích yêu cầu lưu trữ
      • 3.2.3. Phân tích yêu cầu truy vấn
      • 3.2.4. Dự báo lưu lượng giao thông ngắn hạn
    • 3.3. Đề xuất giải pháp cho hệ lưu trữ, truy vấn
      • 3.3.1. Giải pháp công nghệ
      • 3.3.2. Kỹ thuật tối ưu
      • 3.3.3. Giải thuật Support Vector Regression
  • Chương 4: Thực nghiệm và đánh giá kết quả
    • 4.1. Mô hình triển khai
    • 4.2. Kết quả thực nghiệm và đánh giá
      • 4.2.1. Tóm tắt dữ liệu
      • 4.2.2. Một số tính năng phân tích dữ liệu dòng giao thông
      • 4.2.3. Mô hình dự báo lưu lượng giao thông
  • Chương 5: Kết luận
    • 5.1. Kết quả nghiên cứu của đề tài
    • 5.2. Hạn chế luận văn
    • 5.3. Hướng phát triển tiếp theo của đề tài nghiên cứu
  • Danh mục tài liệu tham khảo