Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 50 trang
Dung lượng: 621 KB

Giới thiệu nội dung

Làm giàu và lựa chọn đặc trưng trong phân lớp đa nhãn và áp dụng trong quản lý danh tiếng

Tác giả: Phan Thị Thơm

Lĩnh vực: Công nghệ thông tin

Nội dung tài liệu:

Khóa luận này tập trung vào bài toán xử lý dữ liệu đa nhãn trong hệ thống quản lý danh tiếng. Hệ thống quản lý danh tiếng thu thập ý kiến người dùng về sản phẩm hoặc công ty, sau đó phân tích và tổng hợp để cung cấp thông tin hữu ích. Do ý kiến người dùng thường đề cập đến nhiều khía cạnh, nên dữ liệu này mang tính đa nhãn. Khóa luận đề xuất một phương pháp kết hợp tạo lập đặc trưng dựa trên mô hình chủ đề ẩn LDA với việc lựa chọn đặc trưng sử dụng độ tương hỗ (MI) nhằm nâng cao hiệu quả của thuật toán phân lớp đa nhãn. Nghiên cứu đã thực nghiệm trên tập dữ liệu gồm 1000 đánh giá khách sạn tại Việt Nam, cho thấy giải pháp này đã cải thiện đáng kể kết quả phân lớp dữ liệu đa nhãn.

Mục lục chi tiết:

  • MỞ ĐẦU
  • CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ QUẢN LÝ DANH TIẾNG
    • 1.1. Danh tiếng và các khái niệm liên quan
    • 1.2. Giới thiệu chung về hệ thống quản lý danh tiếng
      • 1.2.1. Sơ bộ về hệ thống quản lý danh tiếng
      • 1.2.3. Tầm quan trọng của hệ thống quản lý danh tiếng
    • 1.3. Phân lớp dữ liệu đa nhãn và bài toán lựa chọn đặc trưng
    • Kết luận chương một
  • CHƯƠNG 2. PHƯƠNG PHÁP LỰA CHỌN ĐẶC TRƯNG TRONG PHÂN LỚP ĐA NHÃN VÀ MÔ HÌNH CHỦ ĐỀ ẨN LDA
    • 2.1. Phương pháp lựa chọn đặc trưng sử dụng độ tương hỗ (MI)
      • 2.1.1. Bài toán lựa chọn đặc trưng
      • 2.1.2. Phương pháp lựa chọn đặc trưng dựa vào độ tương hỗ (MI)
        • 2.1.2.1. Độ tương hỗ MI
        • 2.1.2.2. Phương pháp thực hiện
        • 2.1.2.3. Cách đánh giá
    • 2.2. Mô hình chủ đề ẩn
      • 2.2.1. Mô hình sinh trong LDA
      • 2.2.2. Ước lượng tham số và suy luận
    • Kết luận chương hai
  • CHƯƠNG 3. PHƯƠNG PHÁP LÀM GIÀU VÀ LỰA CHỌN ĐẶC TRƯNG TRONG PHÂN LỚP ĐA NHÃN
    • 3.1. Mô tả phương pháp
    • 3.2. Mô hình đề xuất
    • 3.3. Pha 1. Huấn luyện mô hình
      • 3.3.1. Xây dựng tập đặc trưng bổ xung từ mô hình chủ đề ẩn LDA
      • 3.3.2. Xây dựng vector đặc trưng
      • 3.3.3. Lựa chọn đặc trưng
      • 3.3.4. Phân lớp đa nhãn
    • 3.4. Pha 2. Phân lớp sử dụng mô hình huấn luyện
      • 3.4.1. Tiền xử lý dữ liệu
      • 3.4.2. Lựa chọn đặc trưng
      • 3.4.3. Đánh giá độ chính xác của hệ thống
    • Kết luận chương ba
  • CHƯƠNG 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ
    • 4.1. Môi trường và các cộng cụ sử dụng thực nghiệm
      • 4.1.1. Cấu hình phần cứng
      • 4.1.2. Các phần mềm sử dụng
    • 4.2. Xây dựng tập dữ liệu thử nghiệm
    • 4.3. Thử nghiệm
    • 4.4. Kết quả thực nghiệm
    • 4.5. Đánh giá hệ thống
    • Kết luận
    • Tài liệu tham khảo