Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 43 trang
Dung lượng: 455 KB

Giới thiệu nội dung

CÁC PHƯƠNG PHÁP SẮP HÀNG ĐA CHUỖI NHANH

Tác giả: Nguyễn Hoàng Dũng

Lĩnh vực: Công Nghệ Thông Tin

Nội dung tài liệu:

Khóa luận này tập trung vào lĩnh vực Tin Sinh học (Bioinformatics), một ngành khoa học ứng dụng công nghệ thông tin để giải quyết các vấn đề sinh học. Vấn đề “sắp hàng đa chuỗi” (multiple sequence alignment) đóng vai trò quan trọng trong ngành này, đặc biệt là trong việc phân tích các trình tự ADN và protein. Khóa luận trình bày tổng quan về các phương pháp sắp hàng đa chuỗi phổ biến hiện nay, phân tích ưu nhược điểm của từng phương pháp và đề xuất một giải pháp nhằm tối ưu hóa hiệu quả.

Mục lục chi tiết:

  • Chương 1. Giới thiệu
    • 1.1 Multiple alignment
    • 1.2 Các chương trình sắp hàng đa chuỗi (multiple sequences alignment) thông dụng hiện nay
  • Chương 2. Các phương pháp bắt cặp đa chuỗi
    • 2.1 CLUSTALW
      • 2.1.1 Tính toán ma trận khoảng cách giữa mọi cặp chuỗi
      • 2.1.2 Tạo cây hướng dẫn (guide tree)
      • 2.1.3 Progressive alignment
    • 2.2 MUSCLE
      • 2.2.1 Các loại khoảng cách và các cách xây dựng cây hướng dẫn
      • 2.2.2 Profile alignment
      • 2.2.3 Thuật toán
    • 2.3 MAFFT
      • 2.3.1 Bắt cặp nhóm sử dụng FFT
      • 2.3.2 Hệ thống tính điểm
    • 2.4 PROBCONS
  • Chương 3. Cây quyết định
    • 3.1 Cách giải quyết của Chuong B. Do và Kazutaka Katoh
    • 3.2 Vấn đề tốc độ
      • 3.2.1 Dữ liệu với số lượng chuỗi lớn (> 200 chuỗi)
      • 3.2.2 Dữ liệu với số lượng sequence nhỏ, tổng số amino axit nhỏ
      • 3.2.3 Dữ liệu với độ dài của chuỗi quá lớn (> 2000 amino acids)
    • 3.3 Vấn đề điểm chuẩn (benchmark)
      • 3.3.1 Với các chuỗi có độ tương đồng cao
      • 3.3.2 Với các chuỗi có độ tương đồng thấp
    • 3.4 Cây quyết định
      • 3.4.1 Cây quyết định cho yêu cầu tốc độ xử lý cao
      • 3.4.2 Cây quyết định cho yêu cầu tốc điểm chuẩn cao
  • Chương 4: Kết quả thực nghiệm và bình luận
    • 4.1 Giới thiệu về BAliBASE
      • 4.1.1 BAliBASE 2
      • 4.1.2 BAliBASE 3
      • 4.1.3 Cách đánh giá của BAliBASE
    • 4.2 Kết quả thực nghiệm
  • Chương 5: Kết Luận
  • Tài Liệu Tham Khảo