基于时间序列数据的代谢途径推断:非迭代方法
1. 引言
黄酮类化合物是植物中的一类次生代谢产物,常见于水果和花朵中。它们参与多种生理过程,如花朵、果实和种子的色素沉着、植物生长、抵御紫外线辐射以及与微生物的相互作用。日常饮食中摄入这些化合物与促进人类健康和预防疾病有关,特别是降低心血管疾病、某些癌症和其他与年龄相关疾病的风险。在番茄中,许多参与常见黄酮类生物合成途径的基因已被鉴定,但黄酮类糖基化和甲基化途径中结构修饰的分子基础仍相对未知。糖基化是一种酶促过程,可改变黄酮类化合物的溶解度、化学稳定性和生物学特性,对黄酮类化合物的积累也至关重要。在番茄果实中已报道了几种糖基化黄酮类化合物,其中大多数是黄酮醇槲皮素的衍生物。本文将研究番茄幼苗中槲皮素的生物合成途径。
许多推断代谢反应网络的流行模型依赖于常微分方程,但这种方法存在局限性,尤其是传统方法。传统方法从对参数(反应速率)的初始猜测开始,求解常微分方程,并将离散时间点的解曲线与相应时间点的观测值进行比较。若差异较大,则调整参数并重复比较,直至解与测量值足够接近。尽管大多数数学软件包中都有高效的优化算法,但由于需要反复求解常微分方程,这种方法本质上非常耗时。这在进行大量模拟时,如研究扰动或噪声的影响,会成为一个严重问题。本文提出了一种从观测的代谢物浓度数据快速重建代谢网络的方法。
2. 代谢网络重建
2.1 代谢相互作用建模
代谢途径通常可视化为图形,其中每个节点代表参与反应的底物的摩尔浓度,边代表节点之间的质量通量。为了重建这样的图形,即推断代谢途径,我们需要从化合物浓度的时间序列测量中估计反应速率。一个流行且强大的代谢网络数学模型是一组常微分方程,它取决于初始浓度和反应速率。我们