人工智能药物设计
文章平均质量分 79
桂花树之春
Carpe Diem!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AIDD:Mol2Vec 预训练模型复现
❗注意Mol2Vec模型有一些依赖包,位于".\mol2vec-master\requirements.txt"文件中,安装时要根据自己环境中的python版本以及环境中其他包的版本来确定这些包的安装版本(尤其是gensim)利用圆形分子指纹的表示,计算分子碎片的对应数值,再利用经典的word2vec模型,将数值转换为向量,最后让mol2vec模型学习这些向量。若一个分子的“句子”为 [‘C-1’, ‘O-3’],模型会查找这两个子结构的向量并取平均,最终得到一个300维的分子向量。原创 2025-04-28 17:13:19 · 974 阅读 · 0 评论 -
AIDD:Mol2Vec模型
算法的分子表征方法,旨在将化学分子转换为固定维度的向量(即“分子指纹”),以便用于机器学习任务(如活性预测、性质分类等)。其核心思想是将分子结构类比为自然语言中的“句子”,通过无监督学习捕捉分子子结构的语义信息。Mol2Vec 将这一思想迁移到化学领域,认为化学子结构的“上下文”关系(如官能团的共现模式)隐含分子性质。Mol2Vec 提供了一种高效的方式将分子结构编码为机器学习友好的向量,尤其适用于需要捕捉隐含结构信息的任务。(基于半径的原子环境)将分子分解为子结构。原创 2025-04-28 17:12:20 · 816 阅读 · 0 评论 -
conda安装rdkit失败解决方案
使用时,出现了一些warning。注意要使用镜像源,不然会报。原创 2025-04-26 22:41:26 · 450 阅读 · 0 评论 -
AIDD:基于分子表征的无监督预训练方法
尽管基于图的分子表示包含了基于序列的表示所没有的原始结构信息,但在相同条件下, GNN的效率和吞吐量都低于基于序列的模型。编码器通常用于从原始输入序列中学习信息以生成特征丰富的嵌入向量,而解码器的任务则是根据编码器产生的嵌入向量来恢复原始的输入序列,此外也可以将输入序列转换为不同但语义相似的序列,例如将英文句子翻译成中文句子。,可以借鉴NLP的方法处理基于序列的分子表征任务。:实验表明,参数量大的模型可以通过复杂的任务捕获丰富的语义信息,但在训练超大模型时,必须考虑潜在的 梯度消失和过平滑问题。原创 2025-04-23 22:27:48 · 699 阅读 · 0 评论 -
AIDD:生物分子的化学表征方法
本文介绍了人工智能与药物设计中,关于生物分子的化学表征方法(SIMILES,fingerprint,图…),以及如何借助rdkit库将分子的sdf格式转换为这些表示方法,用以适配机器学习\深度学习模型。原创 2025-04-16 18:00:24 · 1108 阅读 · 0 评论
分享