高通量实验短时间序列数据的曲线拟合及生物变异校正
1. 引言
现代生物学致力于更好地理解细胞内的机制。为实现这一目标,生物学家会测量和比较细胞产物,如代谢物、肽、蛋白质或mRNA,在不同条件下的情况,例如健康细胞与感染细胞的对比。近年来,对时间序列数据的关注日益增加,用于分析细胞产物随时间的行为变化。然而,由于此类实验成本高且耗时,往往只能获得少数时间点的测量值,并且重复实验次数较少。
测量中的噪声以及重复实验中常见的强烈生物变异,使得对这些数据进行连贯分析变得困难。为解决这一问题,我们聚焦于校正测量误差或生物变异导致的偏差,包括时间偏移、反应速度差异和反应强度差异,并提出了一种回归模型来估计相应参数,以校正数据并在后续分析中获得更好的结果。
2. 问题形式化
我们处理的数据结构如下表所示:
| 时间点 | s1 | … | sT |
| — | — | — | — |
| 细胞产物 | 重复1 | … | 重复R |
| i1 | x(1) 1,1 | … | x(R) 1,1 |
| … | … | … | … |
| iN | x(1) N,1 | … | x(R) N,1 |
在理想情况下,所有重复实验的数据应几乎相同,但实际中存在两种影响因素:
- 测量噪声 :来自测量过程和设备,通常无特定偏差或系统结构。
- 生物变异 :部分重复实验中的差异可能由实验设置的小误差或生物
高通量时间序列数据拟合与校正
超级会员免费看
订阅专栏 解锁全文
2749

被折叠的 条评论
为什么被折叠?



