Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 80 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Nghiên cứu phương pháp nén dữ liệu để tăng hiệu quả lưu trữ chuỗi DNA

Tác giả: Cao Thục Tuyết Trinh

Lĩnh vực: Hệ thống thông tin

Nội dung tài liệu:

Luận văn này nghiên cứu các phương pháp nén dữ liệu nhằm nâng cao hiệu quả lưu trữ cho chuỗi DNA. Dữ liệu chuỗi gen ngày càng tăng nhanh do các tiến bộ trong công nghệ giải trình tự, đặt ra thách thức về chi phí lưu trữ và tốc độ truy cập. Bài viết tập trung vào việc đề xuất và đánh giá các thuật toán nén phù hợp với đặc thù của chuỗi DNA, vốn có cấu trúc phức tạp và các quy tắc riêng biệt so với dữ liệu văn bản thông thường. Luận văn khảo sát các phương pháp nén khác nhau, bao gồm mã hóa bit, nén dựa trên bộ từ điển, nén thống kê và nén tham chiếu. Đặc biệt, phương pháp nén tham chiếu được nhấn mạnh về tiềm năng ứng dụng cho dữ liệu chuỗi đa lượng. Các thuật toán như JDNA, được phát triển dựa trên các cải tiến của FRESCO, được xem xét kỹ lưỡng. Bên cạnh đó, luận văn còn thực hiện thực nghiệm so sánh thuật toán JDNA với các thuật toán nén tiêu biểu khác như Huffman và Lempel-Ziv để làm rõ ưu điểm của phương pháp nén tham chiếu.

Mục lục chi tiết:

  • Lời cam đoan
  • Lời cảm ơn
  • Mục lục
  • Danh mục kí hiệu và chữ viết tắt
  • Giới thiệu
  • Chương 1 – Tổng quan về thuật toán nén dữ liệu
  • Chương 2 – Thuật toán nén tham chiếu JDNA
  • Chương 3 – Thực nghiệm so sánh thuật toán JDNA với thuật toán mã hóa Huffman và Lempel – Ziv
  • Kết luận
  • Tài liệu tham khảo