- 博客(32)
- 收藏
- 关注
原创 Zenodo上传文件流程
其中deposition ID为对应的步骤3所创建的doi号最后的红框圈住的数字,[文件路径]即为你要上传的文件的路径。如下图,自己创建个zenodo账户,再创建项目,出现如下界面即可。如下图所示复制红线圈的框框即为Token。最后等号后为上一步的Token。
2025-04-18 09:36:26
434
原创 2023课题DTA学习记录05------读文章MOLE-BERT及代码
文章题目:MOLE-BERT: RETHINKING PRE-TRAINING GRAPH NEURAL NETWORKS FOR MOLECULES发表期刊:ICLR2023发表作者:作者是西湖大学的博士对分子预训练这块也做了一些工作,也写了分子预训练模型的综述A Systematic Survey of Chemical Pre-trained Models,对这一领域有一定的建树文献亮点:1.发现传统的Atrrmask模型进行预训练存在负迁移问题。
2023-09-12 11:01:52
36
原创 2023课题DTA学习记录04------读文章MGraphDTA代码
少层的GNN难以捕获化合物的整体结构,例如两层的GNN无法知道分子中是否存在环,为了捕获更多的邻居组成的结构,应该堆叠k个图卷积层,然后由于过平滑和梯度消失的问题,构建深层次的GNN不太可行。需要构造一个能够保留化合物的局部结构的GNN,GNN应该能将分子中的重要结构与其他不太重要的取代基区分开来,以便做出合理的推断。基于图的DTA模型的可解释性高度依赖于注意力机制,但其增加了计算成本。图注意力机制只考虑顶点的领域,不能捕捉到分子中各个原子之间的全局关系。
2023-09-01 19:48:46
24
原创 2023课题DTA学习记录03------读文章DoubleSG-DTA及代码
问题:虽然之前DTA的模型方法产生了很好的预测结果,但他们很难推广到现实世界。首先,模型必须在广泛的化学空间中区分分子结构;此外,化合物和蛋白质之间复杂的映射模式的建模只是简单的连接,与受体和配体之间的非公价相互作用不符;最重要的是图神经网络是个黑箱模型,解释性有限。因此本文为了解决上面的问题,提出了一种基于GINS和多注意力机制的三通道的DoubleSG-DTA的理论框架,并可视化了图表示中原子的贡献,并将其与分子对接的姿态进行比较,进一步扩展图的模型的可解释性。
2023-08-29 19:17:11
16
原创 2023课题DTA学习记录02------读文章MCSP-DTA
总的来说这篇文章的思想还是很值得学习和思考的,文章要解决的问题是冷启动的问题,作者的思路很巧妙,首先从数据特征来说通过预训练模型得到蛋白质和药物的特征,接着再预训练两个模型分别是CCI和PPI这两个模型可以从理论上来看解决相互作用的表征,以此来解决相互作用的预训练,最后前两个预训练模型整合在一起就形成了一个即包含特征预训练也包含相互作用预训练的模型,可以巧妙的解决冷启动问题,最后预测一下即可。
2023-08-28 10:57:31
17
原创 2023课题DTA学习记录01------NHGNNDTA代码学习复现
首先来大概了解下每个文件夹每个文件是干什么的:文件夹Code:存放所有需要的代码文件夹Data:存放所有需要的数据两个数据集KIBA和Davis文件夹Vocab:存放对蛋白质和药物进行词编码对应的词剩三个文件比较基础不做介绍打开文件夹Code具体来解释下这里的文件:bulid_vocab.py:存放蛋白质和药物序列编码要用到的WordVocab函数,用于对蛋白质和药物进行词编码为数字向量。
2023-08-28 09:33:53
32
原创 《2022 Artificial Intelligence in Drug Design》 笔记--第二章:机器学习在药学和ADMET终点建模中的应用
近年来,定量构效关系(QSAR)这一广为人知的概念引起了人们极大的兴趣。数据、描述符和算法是构建有用的模型的主要支柱,这些模型支持使用计算机方法进行更有效的药物发现过程。这三个领域的重大进展是人们对这些模型重新产生兴趣的原因。在这本书的章节中,我们回顾了各种机器学习(ML)方法,这些方法利用了许多化合物的体外/体内测量数据。我们将这些与其他数字药物发现方法联系起来,并给出了一些应用实例。近年来,定量结构-活性关系(QSAR)[141]这一古老的概念引起了人们的极大兴趣。
2023-08-24 10:24:47
1314
原创 《2022 Artificial Intelligence in Drug Design》 笔记--第一章:人工智能在药物设计中的应用:机遇与挑战
药物设计的过程是一个漫长,复杂和昂贵的过程,但近年来AL/ML/DL爆炸性的发展,极大程度上促进了药物设计的发展,有望改变设计-制造-测试-分析的(DMTA)周期,加快药物设计的过程,降低成本。本书旨在提供药物设计中AL/ML/DL方法的发展和应用的最新技术的概述.主题还包括:1.如何应对这些新技术方法加速和革新传统的药物设计方法,如admet、药物动力学、药物靶标停留时间等。2.这些新方法的应用范围以及它们在哪些方面最大限度地影响当前以及未来的生产率。
2023-08-24 10:24:19
1557
原创 服务器跑深度学习常用方法总结
只需改后面三行代码就行,前面可以直接套用,具体每个代码什么意思就不赘述了。优点:会把每次输出生成一个.out文件方便后期结果查阅保存。缺点:输出没有保存到文件里,如果输出很多不易查看。缺点:不够简介,需要写.slurm文件。以上就是常用的两种操作。2.采用终端指令运行。
2023-08-22 10:35:57
728
1
原创 《PyTorch深度学习实践》刘二大人课程5用pytorch实现线性传播学习笔记
这里简单记录下两个pytorch里的小知识点,其中参数*args代表把前面n个参数变成n元组,**kwargsd会把参数变成一个词典。torch.nn.Linear()是一个类,三个参数,第一个为输入的样本特征,输出的样本特征,同时还有个偏置项,看是否加入偏置。定义模型类,先初始化函数导入需要的线性模型,然后调用预测y值。记住梯度清零然后反向传播,然后梯度更新。定义损失函数和优化器。
2023-04-14 15:49:33
194
原创 python机器学习实战|机器学习入门笔记1-机器学习流程+matplotlib简单应用
python机器学习实战|机器学习入门笔记1-机器学习流程+matplotlib简单应用
2022-07-25 12:42:21
1070
原创 Windows下配置带有GPU深度学习环境 pycharm+anaconda+pytorch+GPU(不单独安装cuda和cudnn)
此教程不单独安装cuda和cudnn,如果GPU是NVIDIA 的可以直接安装pytorch包里面自动安装好cuda即可,安装好此教程可以在pycharm中跑数据进行深度学习相关工作,但是此教程只针对电脑含有NVIDIA英伟达GPU的。...
2022-07-22 19:38:50
3732
11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人