Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 26 trang
Dung lượng: 467 KB

Giới thiệu nội dung

Phân loại câu hỏi pháp quy tiếng Việt sử dụng mô hình BERT

Tác giả: Nguyễn Diệu Linh

Lĩnh vực: Khoa học máy tính

Nội dung tài liệu:

Luận văn này tập trung vào bài toán phân loại câu hỏi pháp quy tiếng Việt, một nhiệm vụ quan trọng trong các hệ thống hỏi đáp tự động. Với sự gia tăng của nhu cầu tìm kiếm thông tin nhanh chóng và chính xác, việc phân loại câu hỏi pháp quy là bước đầu tiên thiết yếu để xử lý hiệu quả các tài liệu pháp luật phức tạp. Luận văn đề xuất sử dụng mô hình BERT, một mô hình học sâu tiên tiến, để giải quyết bài toán phân loại đa nhãn, nơi một câu hỏi có thể thuộc về nhiều lĩnh vực pháp luật khác nhau. Nghiên cứu này so sánh hiệu quả của BERT với các mô hình truyền thống như SVM, cho thấy BERT đạt kết quả vượt trội với độ đo F1 là 89.47%. Luận văn trình bày chi tiết về bài toán, các phương pháp tiếp cận, đặc điểm dữ liệu, cũng như quy trình thực nghiệm và đánh giá kết quả.

Mục lục chi tiết:

  • Chương 1: Giới thiệu bài toán phân loại câu hỏi
    • 1.1 Giới thiệu bài toán phân loại câu hỏi
    • 1.2 Đặc điểm dữ liệu câu hỏi pháp quy
    • 1.3 Một số nghiên cứu liên quan
      • 1.3.1 Một số nghiên cứu cho phân loại đa nhãn
      • 1.3.2 Một số nghiên cứu cho phân loại câu hỏi tiếng Việt
    • 1.4 Các phương pháp phân loại câu hỏi
      • 1.4.1 Phương pháp học máy truyền thống
      • 1.4.2 Phương pháp sử dụng mạng nơ-ron
    • 1.5 Kết luận chương
  • Chương 2: Phân loại câu hỏi pháp quy tiếng Việt sử dụng mô hình BERT
    • 2.1 Bài toán phân loại đa nhãn câu hỏi tiếng Việt
    • 2.2 Giải pháp cho bài toán phân loại đa nhãn
      • 2.2.1 Giải pháp theo phân loại nhị phân
      • 2.2.2 Giải pháp theo phân loại đa nhãn
    • 2.3 Một số mô hình học sâu
      • 2.3.1 Mô hình mạng nơ-ron hồi quy (RNN – Recurrent Neural Network)
      • 2.3.2 Mô hình mạng nơ-ron tích chập (Convolutional Neural Network – CNN)