Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 152 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

NGHIÊN CỨU CẢI TIẾN PHÂN LỚP ĐA NHÃN VĂN BẢN VÀ ỨNG DỤNG

Tác giả: Phạm Thị Ngân

Lĩnh vực: Công nghệ Thông tin

Nội dung tài liệu:

Luận án này tập trung nghiên cứu bài toán phân lớp đa nhãn văn bản tiếng Việt, với mục tiêu đề xuất các phương pháp biểu diễn dữ liệu, lựa chọn đặc trưng và thuật toán phân lớp đa nhãn nhằm nâng cao hiệu quả. Các phương pháp biểu diễn dữ liệu được đề xuất bao gồm mô hình biểu diễn dữ liệu chủ đề ẩn và mô hình biểu diễn dữ liệu theo đồ thị khoảng cách các chủ đề. Bên cạnh đó, luận án cũng đề xuất một thuật toán phân lớp đa nhãn bán giám sát, phát triển từ thuật toán phân cụm bán giám sát đơn nhãn TESC. Nghiên cứu này còn tham gia đóng góp vào dòng nghiên cứu về học phân lớp đơn nhãn văn bản tiếng Việt thông qua hai ứng dụng thực tiễn là đề xuất mô hình gán nhãn thực thể có tên và mô hình hệ tư vấn xã hội. Luận án cũng cung cấp một khảo sát tổng quan về học máy đa nhãn và thực thi các thực nghiệm để kiểm chứng tính hữu dụng của các thuật toán và mô hình được đề xuất, cho thấy tiềm năng ứng dụng cao.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các ký hiệu và chữ viết tắt
  • Danh mục các bảng
  • Danh mục các hình vẽ
  • Mở đầu
  • Chương 1: Từ phân lớp đơn nhãn tới phân lớp đa nhãn
  • Chương 2: Hai mô hình phân lớp đơn nhãn văn bản tiếng Việt
  • Chương 3: Phân lớp đa nhãn văn bản dựa trên biểu diễn dữ liệu theo chủ đề ẩn
  • Chương 4: Kỹ thuật bán giám sát phân lớp đa nhãn văn bản tiếng Việt
  • Kết luận
  • Danh mục công trình khoa học của tác giả liên quan tới luận án
  • Tài liệu tham khảo