Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 48 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Phân tích dữ liệu văn bản dựa trên học máy thế giới mở và ứng dụng

Tác giả: Phạm Thị Quỳnh Trang

Lĩnh vực: Hệ thống thông tin

Nội dung tài liệu:

Luận văn này tập trung vào việc phân tích dữ liệu văn bản bằng cách ứng dụng học máy thế giới mở. Học máy suốt đời (Lifelong Machine Learning – LML) và học máy thế giới mở (OpenWorld ML) là những hướng nghiên cứu mới nhằm bắt chước khả năng học tập liên tục của con người, khắc phục các hạn chế của học máy truyền thống trong môi trường mở và biến động. Học máy thế giới mở có khả năng phát hiện các trường hợp, lớp dữ liệu chưa từng gặp phải trong quá trình huấn luyện, cho phép xây dựng và cập nhật mô hình phân lớp mà không cần huấn luyện lại toàn bộ. Đặc biệt, luận văn đề xuất một mô hình ứng dụng phân lớp học sâu thế giới mở (Deep Open Classification – DOC) cho bài toán chuẩn hóa thực thể tên và phân loại quan hệ trong văn bản y sinh. Đây là một bước tiền đề quan trọng cho việc trích xuất tự động tri thức từ văn bản, một yếu tố cốt lõi trong học suốt đời, đặc biệt trong lĩnh vực y sinh với nhiều thách thức trong việc xác định các biểu hiện tên bệnh mới.

Mục lục chi tiết:

  • Lời cảm ơn
  • Lời cam đoan
  • Tóm tắt
  • Danh sách thuật ngữ và từ viết tắt
  • Danh sách bảng
  • Danh sách hình ảnh
  • Mở đầu
  • Chương 1: Học máy thế giới mở và bài toán chuẩn hóa tên thực thể bệnh
    • 1.1 Học máy truyền thống
    • 1.2 Học máy suốt đời
      • 1.2.1 Định nghĩa học máy suốt đời
      • 1.2.2 Các hướng nghiên cứu LL
    • 1.3 Học máy thế giới mở
    • 1.4 Mục tiêu của luận văn
    • Kết luận Chương 1
  • Chương 2: Học sâu thế giới mở cho văn bản
    • 2.1 Học thế giới mở không gian đơn giản trung tâm
      • 2.1.1 Tăng cường cập nhật mô hình học CBS
      • 2.1.2 Kiểm tra mô hình học CBS
      • 2.1.3 Học CBS cho phát hiện lớp chưa thấy
    • 2.2 Học sâu thế giới mở phân lớp văn bản
      • 2.2.1 CNN và các lớp chuyển tiếp của DOC
      • 2.2.2 Tầng 1- với-phần còn lại
      • 2.2.2 Giảm rủi ro không gian mở
    • Kết luận Chương 2
  • Chương 3: Ứng dụng mô hình DOC vào chuẩn hóa tên bệnh
    • 3.1 Ứng dụng chuẩn hóa tên thực thể bệnh
      • 3.2.1. Mô hình đề xuất
      • Bộ phân giải viết tắt
      • Mạng nơ ron học sâu thế giới mở
    • Kết luận Chương 3
  • Chương 4: Thực nghiệm và đánh giá
    • 4.1 Dữ liệu thực nghiệm chuẩn hoá tên bệnh
    • 4.2 Môi trường và các công cụ thực nghiệm
    • 4.3 Kết quả và đánh giá
  • Kết luận
  • Tài liệu tham khảo