Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 64 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Phân loại Giới Tính Người Dùng Mạng Xã Hội Dựa Vào Tin Nhắn Văn Bản Và Word2Vec

Tác giả: Khổng Bùi Trung

Lĩnh vực: Kỹ thuật phần mềm

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu phương pháp biểu diễn văn bản dưới dạng vector để cải thiện kết quả phân loại giới tính người dùng mạng xã hội dựa trên tin nhắn. Đề tài đề cập đến khái niệm khai phá dữ liệu, các kỹ thuật khai phá dữ liệu phổ biến như phân loại, hồi quy, phân cụm, tổng hợp, mô hình hóa sự phụ thuộc và phát hiện biến đổi, độ lệch. Bên cạnh đó, luận văn cũng phân tích về mạng xã hội, bao gồm định nghĩa, lợi ích và tác hại, cùng các nền tảng phổ biến.

Đặc biệt, luận văn đi sâu vào giới thiệu mô hình Word2Vec và cách xây dựng, bao gồm mô hình Continuous Bag-of-Words (CBOW) và Skip-gram. Phần thực nghiệm trình bày giải pháp ứng dụng Word2Vec để phân loại giới tính người dùng mạng xã hội, bao gồm các bước chuẩn bị dữ liệu, cấu hình, thực hiện và đánh giá kết quả.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1: Tổng quan khai phá dữ liệu và mạng xã hội
  • Chương 2: Word2Vec và mô hình “từ” thành “vector”
  • Chương 3: Ứng dụng Word2Vec vào phân loại giới tính người dùng mạng xã hội
  • Kết luận
  • Tài liệu tham khảo