Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 51 trang
Dung lượng: 1 MB

Giới thiệu nội dung

Dự đoán tác dụng phụ của thuốc từ y văn sử dụng mô hình lai dựa trên mạng nơ ron

Tác giả: Nguyễn Đức Đông

Lĩnh vực: Hệ thống thông tin

Nội dung tài liệu:

Luận văn này tập trung vào việc dự đoán tác dụng phụ của thuốc dựa trên y văn, sử dụng một mô hình lai kết hợp mạng nơ ron tích chập (CNN) và mạng nơ ron hồi quy (RNN). Nghiên cứu giải quyết vấn đề khai phá lượng lớn thông tin y khoa, đặc biệt là các tác dụng phụ của thuốc chưa được liệt kê đầy đủ trong hướng dẫn sử dụng. Mô hình lai được đề xuất nhằm tận dụng điểm mạnh của cả CNN và RNN để xử lý dữ liệu văn bản y sinh hiệu quả hơn. Luận văn cũng trình bày các khía cạnh lý thuyết về thuốc, quy trình phát triển thuốc, các khái niệm cơ bản về khai phá dữ liệu, học sâu, mạng nơ ron, cũng như các phương pháp đánh giá mô hình phân lớp.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục các ký hiệu và chữ viết tắt
  • Danh mục hình vẽ
  • Danh mục bảng biểu
  • Mở đầu
  • Chương 1: Cơ sở lý thuyết
    • 1.1. Thuốc và quy trình phát triển thuốc
      • 1.1.1. Quy trình phát triển thuốc (Drug development process)
      • 1.1.2. Tác dụng phụ của thuốc
    • 1.2. Khai phá dữ liệu và các thuật ngữ liên quan
      • 1.2.1. Định nghĩa về khai phá dữ liệu
      • 1.2.2. Bài toán phân lớp dữ liệu
        • 1.2.2.1. Giới thiệu về bài toán phân lớp
        • 1.2.2.2. Quá trình xây dựng mô hình phân lớp dữ liệu
      • 1.2.3. Học sâu và mạng nơ ron
        • 1.2.3.1. Giới thiệu
        • 1.2.3.2. Mạng nơ ron
        • 1.2.3.3. Mạng nơ ron tích chập
        • 1.2.3.4. Mạng nơ ron hồi quy
      • 1.2.4. Đánh giá mô hình phân lớp
        • 1.2.4.1. Khái niệm
        • 1.2.4.2. Độ chính xác & độ phủ (Precision & Recall)
        • 1.2.4.3. Độ đo trung bình điều hòa F
  • Chương 2: Dự đoán tác dụng phụ của thuốc
    • 2.1. Bài toán dự đoán tác dụng phụ của thuốc từ y văn
      • 2.1.1. Bài toán nhận dạng thực thể bệnh lý và thực thể thuốc (Named Entity Recognition – NER)
      • 2.1.2. Bài toán trích xuất mối quan hệ bệnh lý do thuốc gây ra (Chemical-Induced Disease – CID)
    • 2.2. Bộ dữ liệu BioCreative V CDR
      • 2.2.1. Giới thiệu về Pubmed
      • 2.2.2. Dữ liệu quan hệ thuốc và bệnh – BioCreative V CDR
      • 2.2.3. Cấu trúc kho dữ liệu BioCreative V CDR
      • 2.2.4. Cách thức xử lý dữ liệu BioCreative V CDR làm đầu vào cho bài toán trích xuất quan hệ thuốc và bệnh lý
    • 2.3. Mô hình lai dựa trên mạng nơ ron
      • 2.3.1. Mô hình lai dựa trên mạng nơ ron
      • 2.3.2. Word embedding
      • 2.3.3. Position embedding
      • 2.3.4. Word relation embedding
  • Chương 3: Thực nghiệm và kết luận
    • 3.1. Cài đặt thực nghiệm
      • 3.1.1. Cách thức thực hiện
      • 3.1.2. Các tham số thiết lập mô hình
    • 3.2. Thử nghiệm
      • 3.2.1. Cấu hình phần cứng
      • 3.2.2. Kết quả thực hiện khi cho mô hình học và kiểm tra trên tập dữ liệu test
    • 3.3. Đánh giá
  • Kết luận và hướng phát triển
  • Tài liệu tham khảo