Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 26 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Bioinformatics XML Documents Index Method Based on R-Tree Method

Tác giả: DINH DUC LUONG

Lĩnh vực: Mathematical Foundations for Computer Science

Nội dung tài liệu:

Luận án này tập trung vào phương pháp đánh chỉ mục (indexing) cho tài liệu XML trong lĩnh vực tin sinh học (bioinformatics), sử dụng phương pháp dựa trên R-tree. Tài liệu XML, với cấu trúc bán cấu trúc và kích thước ngày càng lớn, đặt ra thách thức đáng kể cho việc lưu trữ và truy vấn hiệu quả, đặc biệt là trong bối cảnh dữ liệu sinh học như chuỗi DNA, protein. Luận án đề xuất một phương pháp mới, BioX-tree, nhằm cải thiện tốc độ xử lý và giảm kích thước dữ liệu khi đánh chỉ mục. Phương pháp này chuyển đổi dữ liệu XML cấu trúc thành dữ liệu không gian đa chiều, cho phép áp dụng các kỹ thuật đánh chỉ mục không gian. Kết quả thử nghiệm cho thấy phương pháp BioX-tree hiệu quả hơn so với R-tree truyền thống trong việc giảm thiểu số lần truy cập đĩa cứng và tăng tốc độ truy vấn, đặc biệt đối với các truy vấn liên quan đến các nút anh em (sibling queries).