Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 32 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Khai Phá Dữ Liệu Chuỗi Thời Gian Dựa Vào Rút Trích Đặc Trưng Bằng Phương Pháp Điểm Giữa Và Kỹ Thuật Xén

Tác giả: Nguyễn Thành Sơn

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận án tiến sĩ này tập trung vào việc khai phá dữ liệu chuỗi thời gian, một lĩnh vực được đánh giá là quan trọng và đầy thách thức. Với lượng dữ liệu chuỗi thời gian ngày càng lớn và các đặc trưng phức tạp, luận án đề xuất một phương pháp mới mang tên MP_C (Middle Points_Clipping) để thu giảm số chiều dữ liệu. Phương pháp này kết hợp ưu điểm của các kỹ thuật hiện có như PAA, điểm quan trọng và xén, nhằm khắc phục nhược điểm về khả năng lập chỉ mục và độ chính xác.

Luận án trình bày chi tiết về phương pháp MP_C, bao gồm cách biểu diễn dữ liệu, độ đo tương tự trong không gian mới, và cách xây dựng vùng bao MP_C (MP_C_BR) cùng với chỉ mục đường chân trời. Các ứng dụng của phương pháp MP_C được khảo sát bao gồm tìm kiếm tương tự, phát hiện motif xấp xỉ, và gom cụm dữ liệu chuỗi thời gian, đặc biệt là dữ liệu dạng luồng. Luận án cũng đưa ra các kết quả thực nghiệm để đánh giá hiệu quả của phương pháp MP_C so với các phương pháp truyền thống.

Mục lục chi tiết:

  • Giới thiệu
  • Cơ sở lý thuyết và các công trình liên quan
  • Thu giảm số chiều chuỗi thời gian bằng phương pháp MP_C
  • Phát hiện motif dựa vào cấu trúc chỉ mục đa chiều hoặc chỉ mục đường chân trời
  • Gom cụm chuỗi thời gian được thu giảm theo phương pháp MP_C bằng giải thuật I-k-Means
  • Dự báo dữ liệu chuỗi thời gian có tính xu hướng hoặc mùa bằng phương pháp so trùng mẫu
  • Kết luận và hướng phát triển