小分子与药物化学
文章平均质量分 93
分享在小分子制药和AI辅助药物设计领域的知识和进展
镰刀韭菜
视野,意志,品格;目标,坚持,实践
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Enhancing Molecular Property Prediction with Knowledge from Large Language Models
本文把 LLM 提取的“知识特征”与预训练 GNN 的结构表征做可学习融合,并用 MINE 最大化二者的互信息。在 MoleculeNet 上,多数预训练骨干接入 LLM 知识后都有提升;而“把所有 RDKit 描述符一股脑拼上”反而常常掉点。作者还统计了 LLM 规则的重复/冲突率,展示“知识清洗”的必要性。原创 2025-10-31 22:00:00 · 2015 阅读 · 0 评论 -
【药物设计】5分钟快速了解药物设计中什么是motifs?
本文介绍了药物设计中的motifs概念及其应用。Motifs是指分子图中高频出现且具有统计学意义的子结构,与普通分子片段的区别在于其出现频率和特殊化学性质。文中通过示例说明如何识别有效的motif,并强调学习motif有助于分子图表示学习,可类比NLP中的词嵌入技术。此外,文章还介绍了构建motif字典的方法,建议采用环结构分解等高效算法来提取基础子结构,以平衡字典规模和信息完整性。整体而言,motif分析为药物分子设计提供了重要的结构特征提取思路。原创 2025-10-23 08:00:00 · 1164 阅读 · 0 评论 -
【AI4S】大语言模型在药物开发中的应用:当前进展与未来方向
药物开发是一个极其复杂且耗时耗力的过程,传统上以高成本和高失败率为特征。新兴的大型语言模型(LLMs)有望彻底改变药物研发领域,展现出前所未有的数据分析与生成能力。然而,其变革潜力取决于能否有效克服一系列内在挑战。本文认为,将 LLMs 成功整合到药物开发中的关键,在于聚焦提升其可靠性、可解释性,以及与现有生物医学知识和实验验证体系的协同能力。原创 2025-10-21 08:00:00 · 1315 阅读 · 0 评论 -
【AI4S】从直觉到人工智能:药物发现中的小分子表征演变
在药物发现领域,人工智能科学家和化学信息学家的目标是帮助识别分子起始点,从而开发出安全有效的药物,同时降低成本、时间和失败率。为了实现这一目标,以数字格式表示分子至关重要,这种格式使它们具有机器可读性,并有助于准确预测驱动决策的特性。多年来,分子表示已经从直观和人类可读的格式发展到定制的数字描述符和指纹,现在又发展到在广阔的化学空间中捕捉模式和显著特征的学习表示。其中,基于序列和基于图的小分子表示已变得非常流行。原创 2025-10-20 23:00:00 · 1689 阅读 · 0 评论 -
【AI4S】Generative AI 为药物设计带来新思路:寻找“美丽分子”
摘要 生成式人工智能(GenAI)为药物设计提供了新思路,其核心目标是创造兼具合成可行性、优良ADMET特性和靶点亲和力的"美丽分子"。本文提出多参数优化(MPO)框架结合人类反馈强化学习(RLHF)的方法,通过动态平衡药物研发中的多重目标,引导AI生成符合治疗需求的分子。研究探讨了化学表示方法、分子采购策略、MPO评分函数等关键技术,并强调了人类专家在定义"分子之美"中的关键作用。原创 2025-10-20 20:30:00 · 1042 阅读 · 0 评论 -
【AI4S】AI设计小分子药物的三大底层逻辑
传统药物研发像一场豪赌:耗资26亿美元、耗时10年,成功率却不足10%。但AI的加入,让这场赌博变成了“精算游戏”。2025年,全球AI辅助药物管线已占新药研发的35%,其中小分子药物占比超过60%。从辉瑞的AI优化新冠口服药,到英矽智能的全球首款AI抗纤维化药物获批临床,这场革命正以惊人速度重塑行业。今天,我们**从类药性、ADMET预测、生成式模型**三大底层逻辑,揭开AI设计小分子药物的神秘面纱。原创 2025-10-13 23:30:00 · 802 阅读 · 0 评论 -
【AI4S】利用大语言模型 LLM 进行分子设计
摘要: 研究表明,预训练大语言模型(LLM)可有效用于分子设计。通过Claude 3 Opus模型,研究人员利用自然语言提示生成和修改分子,成功率高达97%。研究采用ZINC数据库分子,通过摩根指纹和PCA进行特征化,设计了基本、引导和控制生成三类提示。结果显示,LLM能根据指令调整分子结构特性,如电子结构和相似度,并在潜在空间中呈现不同的探索轨迹。该方法在药物发现和材料科学等领域具有潜在应用价值。原创 2025-10-11 21:30:00 · 901 阅读 · 0 评论 -
【AI4S】基于分子图像与分子描述符的药物筛选预测模型
本文提出了一种结合分子图像与分子描述符的药物筛选预测模型,用于预测药物毒性(LD50)、血脑屏障穿透性(BBBP)和清除率(CL)。研究采用DeepSnap深度学习方法处理分子图像,并通过DataRobot平台构建基于分子描述符的模型。结果显示,集成两种方法的预测模型在AUC和平衡准确率上表现优异(LD50:0.942/0.842;BBBP:0.936/0.853;CL:0.908/0.832),显著优于单一方法。原创 2025-10-05 20:30:00 · 1086 阅读 · 0 评论 -
【AI4S】DrugChat:迈向在药物分子图上实现类似ChatGPT的功能
本文介绍了一种基于人工智能的药物分析系统—— DrugChat,旨在模拟ChatGPT的能力,处理与药物分子图形相关的问题和答案。该系统通过结合图神经网络(GNN)、大型语言模型(LLM)和适配器,能够理解化合物的结构,并对用户提出的关于这些化合物的问题进行多轮交互式回答。作者收集了来自ChEMBL和PubChem的数据集用于训练DrugChat,包含10,834个药物化合物和143,517个问答对。文中详细介绍了数据收集过程、系统的架构及其组成部分的工作原理,并展示了 DrugChat 能够处理各种药物相原创 2025-10-04 20:30:00 · 867 阅读 · 0 评论 -
【AI4S】3DSMILES-GPT:基于词元化语言模型的3D分子生成
分子生成是药物先导物发现和优化领域的一项重要创新技术,但当前这类方法在生成分子的有效性、结构合理性和合成可行性等多属性优化方面存在挑战,精度和效率往往难以两全。 近日,浙江大学药学院康玉副教授、侯廷军教授和谢昌谕教授以及华为刘力维研究员团队在分子生成领域取得突破,成功研发了一种全新的基于纯语言模型的分子生成框架:3DSMILES-GPT。这一框架通过将分子的二维和三维结构视为语言表达,在语言模型的帮助下,实现了药物分子的高效生成。原创 2025-10-04 15:21:40 · 862 阅读 · 0 评论 -
【AI4S】Token-Mol 1.0:基于LLM的token化药物设计
本文介绍一篇来自浙江大学侯廷军、谢昌谕和康玉团队联合发表的一篇论文。该研究提出了一种仅使用词元的三维药物设计模型Token-Mol,可以将二维和三维结构信息以及分子性质编码为离散的词元。Token-Mol基于Transformer解码器构建,采用因果掩码进行训练,并针对回归任务提出了高斯交叉熵损失函数(GCE),取代了传统的交叉熵损失。这种创新的损失函数在训练过程中为每个词元分配权重,使其能够感知数值词元的大小。Token-Mol在多个下游任务的测试中表现优异,有望成为创新药物研发的有力工具。原创 2025-10-03 12:35:54 · 1049 阅读 · 0 评论 -
【AI4S】生成式AI助力药物分子结构优化全面综述
生成式AI在药物分子结构优化中的应用综述:本文系统探讨了生成式AI在目标导向和结构导向的药物分子优化中的最新进展。研究从CADD到AIDD的演化出发,重点分析了骨架跳跃、连接设计、片段替换和侧链修饰等结构导向任务的数据构建与模型开发。文章提出分类框架,阐明结构导向方法在精确控制分子子结构方面的优势,并通过化学空间比喻解释其优于去新设计的原理。同时,针对实际应用中的化学空间限制和多目标优化等挑战,作者提出了结合两种方法的互动策略及参考协议,为实验化学家整合AI工具提供实用指导。原创 2025-10-02 12:30:00 · 1967 阅读 · 0 评论 -
【药物设计】三种分子碎片化方法介绍:Recap、BRICS与eMolFrag
本文介绍了三种分子碎片化方法:RECAP、BRICS与eMolFrag。RECAP通过11种预定义键断裂分子,模拟逆向合成过程,生成树状结构碎片,适用于组合化学构建块筛选。BRICS改进断裂规则并引入重组模体,通过同位素标签和连接原子标记断裂点,产生非冗余碎片集。eMolFrag方法未展开说明。文章详细解析了RECAP的实现原理、断裂规则和RDKit代码应用,并比较了RECAP与BRICS在标记断裂点时的差异。两种方法都注重保留有用片段并避免过度碎片化,为药物发现和分子设计提供有效工具。原创 2025-10-01 21:00:00 · 1085 阅读 · 0 评论 -
【AI4S】分子对接中蛋白质结构和小分子结构的获取
本文介绍了分子对接研究中获取蛋白质和小分子结构的常用方法。对于蛋白质结构,可通过PDB数据库直接下载.pdb文件,或使用NCBI BLAST搜索同源结构,还可利用AlphaFold预测模型。小分子结构获取主要有三种途径:从PDB复合物结构中提取、在PubChem数据库下载3D结构文件(sdf格式),或通过Grade Web Server在线生成。这些方法为分子对接研究提供了可靠的结构数据来源,帮助研究者开展感兴趣的生物分子相互作用分析。文章还提供了各数据库检索和下载操作的具体图示说明。原创 2025-10-01 20:00:00 · 729 阅读 · 0 评论 -
【AI4S】通过单一基础模型双向生成分子的结构和特性
本文提出了一个多模态分子预训练模型,该模型结合了分子结构和生化特性的模态(structure-property multi-modal,SPMM),在一个共同的嵌入空间中对齐结构-性质特征,这使得模型能够考虑分子结构和性质之间的双向信息。这些信息产生了协同知识,从而能够通过单一分子基础模型处理多样化的分子预测下游任务。实验表明模型性能超越了现有方法。原创 2025-09-30 19:00:00 · 1703 阅读 · 0 评论 -
【AI4S】ChemLLM:一种化学大型语言模型
ChemLLM 是一个综合性框架,首次推出了专为化学领域打造的大型语言模型。此外,它还包含 ChemData 数据集,该数据集专为指令微调而设计;以及 ChemBench 基准测试,涵盖了九项关键化学任务,性能卓越。原创 2025-09-30 08:00:00 · 907 阅读 · 0 评论 -
【AI4S】大语言模型与化学的未来,以及整合外部工具和聊天机器人的潜力
在化学领域,语言模型正助力加速分子发现流程,这一点从近期早期药物研发中令人振奋的成果中可见一斑。本文综述了语言模型在分子发现中的关键作用,重点阐述其在从头药物设计、性质预测及反应化学等方面的独特优势。同时,我们特别推介了一系列极具价值的开源软件工具,有效降低了进入科学语言建模领域的门槛。最后,我们展望了未来分子设计的全新愿景:将聊天机器人界面与计算化学工具无缝结合,打造高效便捷的分子设计平台。原创 2025-09-29 21:00:00 · 1014 阅读 · 0 评论 -
【药物设计】ChatDD-水木分子发布的新一代对话式药物研发助手
清华大学孵化的水木分子公司发布新一代对话式药物研发助手ChatDD,基于千亿参数生物医药多模态大模型GhatDD-FM100B开发。该模型通过专业知识增强、多模态对齐等技术,在医药评测中获得超90分成绩。ChatDD聚焦药物立项、临床前研究和临床试验三大场景,可生成立项报告、辅助科研探索和患者筛选。其创新性地将医药研发划分为四个阶段,当前ChatDD代表最新的人机交互模式。底层技术包含多模态数据编码、特征空间对齐等,并已开源轻量科研版模型。产品通过自然语言交互,有效解决传统医药研发信息繁杂、非标准化等痛点。原创 2025-09-27 08:30:00 · 910 阅读 · 0 评论 -
【化学信息学】药物设计中的生物电子等排体
生物等排原理在药物设计中代表了一种成功的策略,被广泛地应用于分子修饰和Me-Too药物设计之中。正确使用分子修饰策略有助于高效地发现新的先导化合物,提高发现有效安全药物的可能性。原创 2022-10-26 08:00:00 · 17690 阅读 · 0 评论 -
【化学信息学】药物靶标的主要类型和结构特征
药物发挥药效,需要与生物体内具有特定功能的生物大分子结合,这个生物大分子就是药物靶标。药物可作用的靶标绝大多数是蛋白质,少量为核酸和糖。那么,它们有什么样的结构特征呢?原创 2022-10-25 08:00:00 · 4204 阅读 · 0 评论 -
【化学信息学】药物的分子结构
药物设计的物质基础是药物和靶标。在体内,药物小分子通过与特定生物大分子靶标产生相互作 用,达到预期的药效。药物的分子结构决定了它的物理化学性质,以及与生物大分子相互作用时表现出来的生物学效 应。通过对上市药物和候选药物的结构进行分析、归纳,可以获得药物分子结构的一些共同特 征,在设计药物分子时参考这些特征,可以有效提高药物研发的成功率。下文介绍药物分子结构 的共同特征。原创 2022-10-24 08:00:00 · 2179 阅读 · 0 评论 -
【化学信息学】计算机辅助药物设计的发展
CADD是一个相当大的论题,涉及到结构化 学、药物化学、分子药理学、生物化学、结构生物学、分子生物学、化学生物学、细胞生物学、 生理学、病理学、生物物理学、组合化学、量子化学、分子力学、分子动力学、分子图形学、计 算化学、化学信息学、生物信息学、X射线晶体学、核磁共振技术、计算机图形技术、数据库技 术和人工智能技术等基础学科和应用学科与技术。融合这些学科知识与技术,CADD在药物作用 和药理活性预测、药效基团研究、药物构效分析、全新药物设计、高通量虚拟筛选及合成数据库 设计等方面展示了强大的威力,大大地提高原创 2022-10-23 08:00:00 · 2173 阅读 · 0 评论 -
【化学信息学】药物研发的过程和意义
现代药物的研发是一个从基因到药物的研究过程,通常经历药物研究和药物开发两大阶段,需要 耗费1-3年时间和2亿美元。药物研究阶段起始于新靶标的发现(Target Discovery),研究人员 从基因研究开始,依靠大量实验数据获得与疾病相关的基因,进一步发现相应的蛋白,然后寻找 与疾病相关的药物靶标,再对它们进行靶标验证(Target Validation)。在这个基础上,研究人 员运用结构生物学手段,解析靶标的三维结构,发现和优化先导化合物(Lead Compound Identification and原创 2022-10-22 08:00:00 · 2349 阅读 · 0 评论
分享