Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 152 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng

Tác giả: Phạm Thị Ngân

Lĩnh vực: Công nghệ thông tin (Chuyên ngành: Hệ thống thông tin)

Nội dung tài liệu:

Luận án tập trung vào bài toán phân lớp đa nhãn (Multi-Label Classification: MLC) trong lĩnh vực công nghệ thông tin, đặc biệt là phân lớp văn bản tiếng Việt. Phân lớp dữ liệu tự động là một chủ đề quan trọng trong khai phá dữ liệu, và phân lớp đa nhãn là một hướng phát triển phức tạp hơn so với phân lớp đơn nhãn truyền thống, cho phép một đối tượng dữ liệu có thể được gán nhiều nhãn cùng lúc. Luận án đề xuất các phương pháp biểu diễn dữ liệu, lựa chọn đặc trưng và thuật toán phân lớp đa nhãn, bao gồm cả phương pháp bán giám sát, nhằm nâng cao hiệu quả cho bài toán phân lớp văn bản tiếng Việt. Các đề xuất này được kiểm chứng thông qua các thực nghiệm, cho thấy tiềm năng ứng dụng cao.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các ký hiệu và chữ viết tắt
  • Danh mục các bảng
  • Danh mục các hình vẽ
  • Mở đầu
  • Chương 1: Từ phân lớp đơn nhãn tới phân lớp đa nhãn
  • Chương 2: Hai mô hình phân lớp đơn nhãn văn bản tiếng Việt
  • Chương 3: Phân lớp đa nhãn văn bản dựa trên biểu diễn dữ liệu theo chủ đề ẩn
  • Chương 4: Kỹ thuật bán giám sát phân lớp đa nhãn văn bản tiếng Việt
  • Kết luận
  • Danh mục công trình khoa học của tác giả liên quan tới luận án
  • Tài liệu tham khảo