Xem trước tài liệu

Đang tải tài liệu...

Thông tin chi tiết tài liệu

Định dạng: PDF
Số trang: 15 trang
Dung lượng: Đang cập nhật

Giới thiệu nội dung

Clustering Time Series Gene Expression Data Based on Sum-of-Exponentials Fitting

Tác giả: Ciprian Doru Giurcăneanu, Ioan Tăbuş, Jaakko Astola

Lĩnh vực: EURASIP Journal on Applied Signal Processing

Nội dung tài liệu:
Bài báo này trình bày một phương pháp mới để phân cụm dữ liệu chuỗi thời gian biểu hiện gen. Phương pháp này dựa trên việc khớp mô hình tổng các hàm mũ với dữ liệu được lấy mẫu không đều. Cấu trúc của mô hình được ước tính bằng nguyên lý độ dài mô tả tối thiểu (MDL), kết hợp với mô hình ước lượng khả năng cực đại được chuẩn hóa (NML) cho một tập hợp con các tham số. Hiệu suất của phương pháp ước tính cấu trúc được đánh giá bằng dữ liệu mô phỏng, cho thấy ưu điểm so với các tiêu chí lựa chọn trước đó. Độ chính xác của các ước lượng phi tuyến của tham số mô hình được phân tích so với các giới hạn dưới Cramér-Rao. Các ví dụ phân cụm tập dữ liệu biểu hiện gen từ ứng dụng sinh học phát triển được trình bày, cho thấy sự nhóm gen theo các lớp chức năng.

Mục lục chi tiết:
1. INTRODUCTION
2. FITTING A SUM OF EXPONENTIALS TO NONUNIFORMLY SAMPLED DATA
2.1. Motivation
2.2. Problem formulation
2.3. An estimation procedure for the nonlinear regression model
3. GENE CLUSTERING
3.1. New clustering algorithm
3.2. Experimental results with simulated data
4. CLUSTERING THE GENE EXPRESSION DATA SAMPLED DURING POSTNATAL DEVELOPMENT OF MOUSE DENTATE GYRUS AND CEREBELLUM
4.1. Data sets from developmental biology
4.2. Fitting the sum-of-exponentials model
4.3. Clustering the selected genes
4.4. Enrichment of functional categories
APPENDICES
A. THE SEPARABILITY OF PARAMETERS FOR THE LS PROBLEM
B. COMPUTATION OF CRAMÉR-RAO LOWER BOUND (CRLB)