机器学习在基因组学中的常见使用陷阱
Nature Reviews Genetics| 在基因组学中应用机器学习的常见陷阱
原文地址:https://www.nature.com/articles/s41576-021-00434-9
1. 摘要
如今,遗传(genetic)
、表观基因组学(epigenomic)
、转录组学(transcriptomic)
、化学信息学(cheminformatic)
和蛋白质组学(proteomic)
数据的规模,加上易于使用的机器学习(ML)
工具包,推动了监督学习在基因组学研究中的应用。
然而,ML软件中 统计模型(statistical models) 和
性能评估(performance evaluations) 背后的假设在
生物系统(biological syste