基于时间分辨数据和稳健相关性度量的高通量实验单样本时间点估计
一、引言
现代高通量技术,如质谱和微阵列的最新进展,使得在不同条件下随时间测量蛋白质、肽和 mRNA 等细胞产物成为可能。这也让研究人员面临大量通过这些技术实验获得的测量数据。
在生物学和化学领域,基于微阵列的基因组调查以及从基因组学到组合化学等一系列高通量方法变得越来越重要。为了从测量数据中提取有用和相关的信息,生物学家需要数据分析方法来应对生物系统的复杂性。
要理解和建模生物系统,考虑其随时间的动态变化是必要的。然而,由于实验设置和测量设备的限制,很多情况下只能获取两个不同状态或时间点的快照并进行比较。近年来技术的进步,使得能够在多个时间点进行测量,但可测量的时间点数量通常仍然非常有限,所以时间点的选择非常谨慎,以覆盖最感兴趣的时间点。因此,使用“时间分辨数据”而非“时间序列数据”这一术语。
我们主要关注两个问题:一是给定时间分辨实验的多个重复数据和一个未知时间点的测量值,能否对未知时间点进行良好的估计;二是重复数据是否显示出一致的行为,还是彼此差异很大。
在这项工作中,我们使用 30 多位患者的数据研究了不同时间点细胞产物之间的关系。从患者数据中得出的相关性为来自其他独立样本的时间点提供了相当准确的估计。由于时间分辨实验的多次实现通常包含测量值的系统变化,以及生物和医学数据中存在随机扰动,我们使用了 R 包 Rococo 中免费提供的稳健秩相关度量来推导不同时间点重复数据集之间的关系。这种秩相关度量对噪声数值数据表现出更平滑的行为,并且对小样本的噪声具有更强的鲁棒性,从而能够准确估计单样本的时间进程。
二、秩相关度量
相关度量在分
超级会员免费看
订阅专栏 解锁全文
2185

被折叠的 条评论
为什么被折叠?



