Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 27 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Ứng Dụng Mô Hình Maximum Entropy Trong Phân Lớp Quan Điểm Cho Dữ Liệu Văn Bản

Tác giả: Phạm Nguyên Bình

Lĩnh vực: Công nghệ thông tin, Kỹ thuật phần mềm

Nội dung tài liệu:

Luận văn này nghiên cứu về bài toán phân lớp quan điểm người dùng trên dữ liệu văn bản, đặc biệt tập trung vào việc ứng dụng mô hình Maximum Entropy. Bài toán phân tích quan điểm (opinion mining/sentiment analysis) là một lĩnh vực nghiên cứu quan trọng, thu hút sự quan tâm lớn nhờ vào sự đa dạng trong ứng dụng, sự bùng nổ của thông tin trên mạng xã hội và tính thách thức của bài toán. Quan điểm được phân loại thành tích cực, tiêu cực và trung lập, và có thể được giải quyết ở các mức độ: văn bản, câu, và khía cạnh.

Luận văn giới thiệu các hướng tiếp cận chính, bao gồm việc sử dụng các thuật toán học máy. Các thuật toán học máy có giám sát phổ biến như Naïve Bayes, Support Vector Machine (SVM) và Maximum Entropy được xem xét. Mô hình Naïve Bayes dựa trên lý thuyết Bayes về xác suất có điều kiện, còn SVM là phương pháp tìm siêu phẳng tối ưu để phân tách dữ liệu. Tuy nhiên, do những hạn chế của các mô hình trước, mô hình Maximum Entropy ra đời để giải quyết hiệu quả bài toán phân lớp dữ liệu dạng văn bản.

Nghiên cứu cũng trình bày về hệ thống VNU-SMM (Vietnam National University-Social Media Monitoring) với kiến trúc tổng quan gồm ba khối chức năng chính: thu thập dữ liệu tự động, theo dõi và giám sát thông tin trực tuyến, và giao diện tương tác với người dùng cuối. Hệ thống này được thiết kế để tự động thu thập, xử lý, phân tích một lượng lớn thông tin từ các kênh truyền thông xã hội, hỗ trợ quản lý và ra quyết định.

Mục lục chi tiết:

  • Mở đầu
  • Chương 1: Bài toán phân lớp quan điểm và các hướng tiếp cận
  • Chương 2: Tổng quan hệ thống VNU-SMM
  • Chương 3: Bộ phân lớp Maximum Entropy
  • Chương 4: Kết quả thử nghiệm và đánh giá
  • Chương 5: Tổng kết và hướng phát triển tiếp theo