Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 127 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế

Tác giả: Dương Tấn Nghĩa

Lĩnh vực: Kỹ thuật Điện tử

Nội dung tài liệu:

Luận án này tập trung nghiên cứu các phương pháp và thuật toán xử lý dữ liệu trong hệ thống gợi ý (RS) nhằm tăng cường chất lượng thông tin. Mục tiêu là xử lý và phân tích dữ liệu thu thập được để tăng tính chính xác và nhất quán của thông tin đầu ra, phục vụ cho việc triển khai RS trên các thiết bị biên. Luận án đề xuất các phương pháp cải tiến thuật toán đo độ tương đồng trong lọc cộng tác, áp dụng kỹ thuật học sâu để biểu diễn sản phẩm, và sinh dữ liệu người dùng nhân tạo cho lọc cộng tác, nhằm cung cấp gợi ý cá nhân hóa và phù hợp hơn.

Mục lục chi tiết:

  • MỤC LỤC
  • DANH MỤC CÁC TỪ VIẾT TẮT
  • DANH MỤC KÝ HIỆU TOÁN HỌC
  • DANH MỤC HÌNH VẼ
  • DANH MỤC BẢNG BIỂU
  • MỞ ĐẦU
    • 1. Giới thiệu chung về hệ thống gợi ý
    • 1.1. Khái niệm hệ thống gợi ý
    • 1.2. Tình hình nghiên cứu hệ thống gợi ý trên thế giới và ở Việt Nam
    • 2. Tính cần thiết của luận án và những vấn đề sẽ giải quyết
    • 3. Mục tiêu, đối tượng, phạm vi và phương pháp nghiên cứu
    • 4. Các đóng góp mới của luận án
    • 5. Cấu trúc nội dung của luận án
  • CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG GỢI Ý
    • 1.1. Ma trận lịch sử tương tác trong hệ thống gợi ý
    • 1.2. Các phương án triển khai hệ thống gợi ý
      • 1.2.1. Hệ thống gợi ý dựa trên nội dung
      • 1.2.2. Lọc cộng tác dựa trên ghi nhớ
      • 1.2.3. Lọc cộng tác dựa trên mô hình
    • 1.3. Thiết lập thực nghiệm
      • 1.3.1. Tập dữ liệu MovieLens 20M
      • 1.3.2. Tập dữ liệu MovieLens 25M
      • 1.3.3. Phương pháp đánh giá
    • 1.4. Kết luận
  • CHƯƠNG 2. CẢI THIỆN THUẬT TOÁN ĐO ĐỘ TƯƠNG ĐỒNG GIỮA HAI SẢN PHẨM TRONG LỌC CỘNG TÁC DỰA TRÊN GHI NHỚ
    • 2.1. Hạn chế của các phép đo độ tương đồng truyền thống trong hệ thống gợi ý
      • 2.1.1. Hạn chế trong phân bố thống kê độ tương đồng
      • 2.1.2. Hạn chế của dữ liệu lịch sử đánh giá trong tính toán ma trận tương đồng
    • 2.2. Phương pháp tính độ tương đồng mới cải thiện hạn chế trong phân bố thống kê
    • 2.3. Phương pháp Lọc cộng tác dựa theo ghi nhớ tích hợp nội dung sản phẩm
      • 2.3.1. Dữ liệu Tag Genome trong tập dữ liệu MovieLens 20M và 25M
      • 2.3.2. Phương pháp tích hợp nội dung của sản phẩm vào hệ thống lọc cộng tác dựa theo ghi nhớ
      • 2.3.3. Xây dựng ma trận tương đồng kết hợp trong hệ thống gợi ý dựa trên ghi nhớ
    • 2.4. Kết quả thực nghiệm
      • 2.4.1. Các mô hình tham chiếu
      • 2.4.2. Kết quả các phương pháp giúp cải thiện phân bố thống kê của ma trận tương đồng
      • 2.4.3. Kết quả tích hợp nội dung của sản phẩm vào hệ thống lọc cộng tác dựa theo ghi nhớ
      • 2.4.4. Kết quả tích hợp ma trận tương đồng kết hợp trong hệ thống gợi ý dựa trên ghi nhớ
      • 2.4.5. Kết quả triển khai các mô hình trên thiết bị máy tính Jetson Nano
    • 2.5. Kết luận
  • CHƯƠNG 3. HỆ THỐNG GỢI Ý ÁP DỤNG CÁCH THỨC BIỂU DIỄN SẢN PHẨM SỬ DỤNG CÁC KỸ THUẬT HỌC SÂU
    • 3.1. Phương pháp nhóm các thẻ tương đồng trong dữ liệu Tag Genome bằng kỹ thuật xử lý ngôn ngữ tự nhiên
    • 3.2. Phương pháp học cách biểu diễn mới cho các sản phẩm qua Bộ tự mã hóa
      • 3.2.1. Kiến trúc Bộ tự mã hóa
      • 3.2.2. Áp dụng Bộ tự mã hoá nhằm biểu diễn sản phẩm
    • 3.3. Học cách biểu diễn mới cho mỗi bộ phim với Bộ tự mã hóa bán chập
      • 3.3.1. Cơ sở áp dụng CNN cho dữ liệu bảng
      • 3.3.2. Sơ lược về kiến trúc mạng nơ-ron chập một chiều
      • 3.3.3. Sơ lược về Bộ tự mã hóa chập – CAE
      • 3.3.4. Thiết kế Bộ tự mã hóa bán chập
    • 3.4. Kết quả thực nghiệm
      • 3.4.1. Các mô hình tham chiếu
      • 3.4.2. Kết quả mô hình sử dụng phương pháp nhóm các thẻ tương đồng trong dữ liệu Tag Genome bằng kỹ thuật xử lý ngôn ngữ tự nhiên
      • 3.4.3. Kết quả mô hình sử dụng cách biểu diễn mới cho các sản phẩm qua Bộ tự mã hóa
      • 3.4.4. Kết quả áp dụng biểu diễn mới cho mỗi bộ phim với Bộ tự mã hóa bán chập
      • 3.4.5. Kết quả triển khai các mô hình trên thiết bị máy tính Jetson Nano
    • 3.5. Kết luận
  • CHƯƠNG 4. PHƯƠNG PHÁP SINH DỮ LIỆU NGƯỜI DÙNG NHÂN TẠO ỨNG DỤNG TRONG LỌC CỘNG TÁC
    • 4.1. Biểu diễn người dùng qua nội dung sản phẩm và thông tin đánh giá
    • 4.2. Tích hợp độ tương quan người dùng – sản phẩm vào ước lượng cơ sở
    • 4.3. Áp dụng nội dung sản phẩm vào bài toán khởi tạo cho mô hình phân rã ma trận
    • 4.4. Kết quả thí nghiệm
      • 4.4.1. Tích hợp độ tương quan người dùng – sản phẩm vào ước lượng cơ sở
      • 4.4.2. Áp dụng nội dung sản phẩm vào bài toán khởi tạo cho mô hình MF
      • 4.4.3. Kết quả triển khai các mô hình trên thiết bị máy tính Jetson Nano
    • 4.5. Kết luận
  • KẾT LUẬN
    • Những kết quả đạt được
    • Hướng nghiên cứu tiếp theo
  • DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ