Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 25 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Nghiên cứu phương pháp nén dữ liệu để tăng hiệu quả lưu trữ chuỗi DNA

Tác giả: Cao Thục Tuyết Trinh

Lĩnh vực: Hệ thống thông tin

Nội dung tài liệu:

Luận văn này tập trung nghiên cứu các phương pháp nén dữ liệu chuỗi DNA nhằm mục đích tăng hiệu quả lưu trữ. Chuỗi DNA, với cấu trúc phức tạp gồm 4 loại đơn vị nucleotide (A, T, G, C), tạo ra một khối lượng dữ liệu khổng lồ, đặt ra thách thức lớn về chi phí lưu trữ và tốc độ truy cập. Các thuật toán nén truyền thống thường không phù hợp với đặc thù của dữ liệu DNA do sự phức tạp và tính không ngẫu nhiên của các chuỗi. Do đó, nhiều thuật toán nén chuyên biệt cho chuỗi DNA đã được phát triển. Luận văn sẽ đi sâu vào phân tích và so sánh hiệu quả của các phương pháp nén khác nhau, bao gồm nén dựa trên bộ từ điển, nén thống kê, và đặc biệt là nén tham chiếu, với trọng tâm là thuật toán JDNA. JDNA, một khung nén tham chiếu hiệu quả, được xây dựng dựa trên thuật toán nhanh và mã nguồn mở FRESCO, mang lại những cải tiến đáng kể về tỉ lệ nén và dung lượng lưu trữ.

Mục lục chi tiết:

  • Chương 1 – Tổng quan về thuật toán nén dữ liệu
  • Chương 2 – Thuật toán nén tham chiếu JDNA