AMiner论文推荐

论文名称:Evolutionarily informed machine learning enhances the power of predictive gene-to-phenotype relationships
论文链接:
https://www.aminer.cn/pub/6153e35a5244ab9dcb3d3922?f=cs
从基因组规模的信息中准确预测复杂的表型特征是一个挑战。有几个因素导致了这些挑战。首先,与越来越多的组学数据的可用性相反,从充分代表表型多样性空间的遗传多样性人群中收集高质量的表型数据已成为主要的限制因素。此外,表型数据通常是从与用于获取功能基因组数据的实验不同的实验中收集的。为了克服这些限制,表型分析工作应该扩大并在作为遗传/基因组信息来源的相同材料上进行。组学数据的爆炸式增长意味着从单个实验中收集的特征(例如基因数量)不可避免地超过表型空间(例如样本量),从而导致数据稀疏、多重共线性、多重测试和过度拟合等问题。这可以通过增加样本大小、降维或特征选择方法来抵消,例如主成分分析(PCA)、最小绝对收缩和选择算子(LASSO)正则化、典型相关分析(CCA)等。在机器学习环境中采用了跨物种方法来提高模型到人类知识翻译的性能。
在该研究中,研究人员通过使用基于进化的机器学习方法来解决这些挑战,该方法利用物种内和物种间的遗传多样性。在具有实际意义的原理验证研究中,利用氮响应基因的转录组数据来预测氮利用效率 (NUE),这是对全球食品安全和可持续性至关重要的农艺结果。氮(N)——植物生长的主要限制性常量营养素——通过施氮肥在农业系统中得到补充。对于玉米等主要中耕作物,植物吸收了不到 40% 的氮,而超过 60% 的土壤氮通过反硝化、氨氮挥发、浸出等多种过程流失到大气或水体中 。平衡进一步提高作物产量的需要,同时减轻与氮肥相关的环境影响,是可持续农业的挑战。考虑到 NUE 涉及发育、生理和代谢过程的整合的多基因性质,机器学习是解决这一复杂特征背后机制的有吸引力的策略。为此,研究人员从两个物种——玉米(一种作物)和拟南芥(一种模式生物)——中收集了转录组学和表型 NUE 数据,每个物种都包括一组具有不同遗传背景和 NUE 变异的基因型。研究人员使用基因(基因对「N 处理」或「N-DEG」 的反应,在物种内部和物种之间是保守的),作为机器学习的降维方法。由于玉米和拟南芥在系统发育上高度不同,这些进化上保守的 N 反应基因应该代表有助于 NUE 的基本/核心功能。
AMiner,让AI帮你理解科学!https://www.aminer.cn
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值