学术速运|MISATO -用于基于结构的药物发现的蛋白质-配体复合物的机器学习数据集

MISATO是一个结合量子力学和分子动力学的新数据集,包含约20000个蛋白质配体复合物,用于结构药物发现的机器学习研究。它提供了最大的蛋白质配体复合物MD轨迹,总计170μs,旨在促进AI模型的发展,同时提供ML基线和易于使用的数据加载器。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

​题目:MISATO - Machine learning dataset of  protein-ligand complexes for structure-based drug discovery

文献来源: https://doi.org/10.1101/2023.05.24.542082 (biorxiv)

代码:https://github.com/t7morgen/misatodataset

简介:大型语言模型(llm)极大地提高了我们理解生物学和化学的能力。然而,基于结构的药物发现的可靠方法相对较少。迫切需要高度精确的生物分子-配体相互作用数据集,特别是对于需要大量训练数据的llm。作者提出了MISATO,第一个结合了小分子的量子力学性质和相关的分子动力学模拟约20000个实验蛋白质配体复合物的数据集。从PDBbind数据集开始,我们使用半经验量子力学来系统地细化这些结构。迄今为止最大的蛋白质配体复合物的分子动力学痕迹收集物,积累到170 μs。我们提供了ML基线模型和简单的Python数据加载器,并旨在围绕MISATO培养一个蓬勃发展的社区,为ML专家提供了一个简单的切入点,而不需要深入的领域专业知识来实现下一代药物发现人工智能模型。

主要内容:

-------------------------------------------

欢迎点赞收藏转发!

下次见!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值