题目:UniDL4BioPep: a universal deep learning architecture for binary classification in peptide bioactivity
文献来源:Briefings in Bioinformatics, 2023, 1–10
代码:https://github.com/dzjxzyd/UniDL4BioPep
简介:通过模型预测鉴定有效肽可以减少湿实验中的基准工作。然而,由于肽表示、特征选择、模型选择和超参数调优等挑战,传统的模型构建过程可能复杂且耗时。最近,先进的预训练的基于深度学习的语言模型(LMs)可以用于蛋白质序列的嵌入,并应用于结构和功能的预测。基于这些发展,作者开发了UniDL4BioPep,这是一种通用的深度学习模型体系结构,用于生物活性肽二元分类建模中的转移学习。它可以直接帮助用户训练一个具有固定架构的高性能深度学习模型,并实现先进的性能,以满足高效的新型生物活性肽发现的需求。这是第一次将预先训练好的生物语言模型用于肽嵌入,并通过对这些肽嵌入的大规模评估,成功地预测了肽的生物活性。通过均匀流形近似和投影分析,对该模型进行了验证。通过将LM与卷积神经网络相结合,UniDL4BioPep在20个不同的生物活性数据集预测任务中的15个中获得了比各自最先进的模型更高的性能。精度、Mathews相关系数和曲线下面积分别高出0.7-7、1.23-26.7和0.3-25.6%。
主要内容:
-------------------------------------------
欢迎点赞收藏转发!
下次见!