- 博客(60)
- 收藏
- 关注
原创 化学结构文件格式全景报告:从手绘草图到AI原生语义——格式演化、深度比较、应用实践与未来范式
本文系统梳理18种主流化学结构文件格式的演变历程、技术特点与应用场景。从1860年代的手绘符号到2020年代的AI原生格式,化学结构表达经历了四次范式跃迁。报告详细比较SMILES、InChI、Molfile、SDF、PDB、mmCIF等格式在化学保真度、三维支持、AI友好性等12个维度的表现,并结合药物发现、量子计算、AI训练等12大应用场景给出选型建议。提出下一代AI原生结构表征应具备的五大特征:语义可执行、多模态融合、不确定性表达、知识图谱集成和硬件感知,为化学信息学基础设施的升级提供战略指引。
2025-12-29 17:45:00
371
原创 零失误驾驭化学结构表达式 InChI和 InChIKey: 设计原理、规则、转换方式和实践经验汇总
本文是目前最权威、最实用、最新(2025年)的 InChI 实战指南资源汇总,助你零失误驾驭 InChI和 InChIKey。包括编码规则,支持的软件,在药物申报中的应用等实践指南。
2025-12-29 17:45:00
945
原创 IUPAC 有机化合物系统命名法(2025年最新版)深度指南-全面、权威、实用的
《IUPAC有机化合物命名法(2025)权威指南》摘要:本指南基于IUPAC最新规范,系统解析有机化合物命名的六步核心流程,重点剖析12类命名难点,提供中英文官能团对照表、7款命名软件实测对比(含RDKit/OPSIN等工具代码示例),并详解NMPA、FDA对命名的监管要求。特别包含一键生成合规命名的Python脚本(双引擎验证),适用于科研、制药及申报场景。所有规则均通过PubChem等数据库验证,强调命名准确性与监管合规性。
2025-12-29 17:45:00
660
原创 SMILES: 化学分子线性输入系统,深度实战指南,从规范到生产环境
本文详细介绍化学分子结构SMILES的规则分类、详细规则以及相关软件。附一键复现命令(含 conda 环境配置)。所有示例均经实测(使用 RDKit 2024.9、gemmi 2024.9、Open Babel 3.1.1),代码可直接运行。
2025-12-28 17:45:00
828
原创 PDB 结构文件详尽报告: 格式、标准、质量评估与实践指南——面向结构生物学、药物设计与AI for Science 研究者的权威综述(2025年更新)
本文介绍了PDB结构的文件历史沿革及今后发展趋势,PDB文件能用来记录那些大分子,PDB文件的质量如何判断,提供一些通用指标以及计算指标的通用工具,并提供通过标准化流程提取配体结合位点并自动生成Pymol高亮脚本,以及批量生成PDB质量报告。最后提供分子模拟的最佳实践工作流和官方的权威文档列表,文章提供的一系列脚本为分子模拟的程序自动化提供有益借鉴。
2025-12-28 07:00:00
516
原创 InChIKey: 分子的“化学身份证”,从哈希原理到全球监管合规(2025)
本文全面解析InChIKey这一全球通用的化学结构标识符。InChIKey通过27字符编码分子骨架、立体化学和版本信息,已成为FDA/NMPA/EMA等监管机构强制使用的化学身份证。指南详细介绍了其生成逻辑、结构解析能力(可区分立体异构体/互变异构体/盐类)以及2025年最新碰撞数据(理论概率<10⁻¹⁸)。文章包含RDKit/Python实操代码、NMPA申报案例分析和避坑指南。
2025-12-27 17:45:00
626
原创 PDB: 结构生物学的“宪法级”格式,但90%使用者从未真正读懂它
本文系统解析PDB格式文件在结构生物学研究中的关键作用与常见陷阱。作为实验观测日志而非分子结构文件,PDB记录原子坐标但不存储化学键、电荷或质子化状态。文章详细剖析了PDB字段设计(如altLoc、occupancy)对后续分析的影响,并提供了gemmi+RDKit组合处理配体的实战代码。针对X-ray/cryo-EM/NMR不同数据特点,提出预处理流程,强调保留原始文件的重要性。特别指出2025年AI结构预测背景下PDB的新角色,并为FDA/EMBL申报提供合规性建议。
2025-12-27 07:00:00
2139
原创 RFdiffusion2: David Baker及MIT团队深度生成模型用于原子级酶活性位点支架构建,本地安装及问题解决
本文提供了RFdiffusion2完整的安装指南,包括cond环境配置、依赖项安装及常见问题解决方案,支持通过Apptainer容器运行示例。RFdiffusion2是由David Baker及MIT团开发的新型AI蛋白质设计工具,可直接从原子级催化基团(theozyme)生成精确匹配的酶骨架,突破了传统方法依赖预定义残基位置的限制。该模型在41个活性位点测试中全部成功,实验验证显示仅需不到96个序列即可获得活性酶。RFdiffusion2实现了从纯化学原理到功能性酶的全自动设计,为酶工程领域带来重大突破。
2025-12-25 17:45:01
1088
原创 EvoBind2: 基于蛋白质序列信息设计线肽及环肽结合分子
本文提供EvoBind的介绍,本地安装以及使用方法,并提供自动化脚本提取最优结果,为新型治疗性多肽设计提供了高效解决方案。该方法摆脱了对靶标结构的依赖,实现了从单一序列出发的端到端肽结合剂设计。本研究提出EvoBind2方法,仅需靶蛋白序列即可设计新型线性和环状肽结合剂。该方法通过改进版AlphaFold2迭代优化肽序列与结构,结合对抗性验证和实验评估,成功设计了高亲和力肽结合剂(最优线性肽Kd=7.5nM,比野生型提高162倍)。
2025-12-24 17:45:00
1082
原创 PepINVENT: 基于生成式强化学习生成包含非天然氨基酸多肽的开源框架,本地安装及简便使用说明
文章详细介绍了PepINVENT在本地安装配置方法,包括克隆GitHub仓库、创建conda环境、配置JSON参数文件等步骤,并提供了序列转换脚本以简化输入准备。PepINVENT是由阿斯利康和哥德堡大学联合开发的基于生成式强化学习的开源多肽设计框架。该工具通过结合Transformer架构和强化学习,能够生成包含天然与非天然氨基酸的新型多肽,显著拓展了多肽设计的化学空间。
2025-12-23 17:45:00
899
原创 ODesign: 全模态智能分子设计师,实现核酸/蛋白质/小分子多形态分子的一键式设计,conda环境配置及使用介绍
本文提供完整的本地部署方案,支持Ubuntu22.04+CUDA12.1环境下的conda安装。ODesign支持蛋白质柔性/刚性设计、小分子配体设计等场景,预测推理效率高。ODesign是全球首个通用分子设计AI模型,由临港实验室联合国际顶尖科研机构开发。该模型突破传统单模态限制,实现对蛋白质、核酸、小分子等多种生物分子的统一表征与协同生成。核心技术包括多层级分子表征体系、多尺度条件控制机制等五大模块,在11项标准任务中性能全面领先。
2025-12-21 15:13:10
1040
原创 NeuralPLexer: 多尺度生成模型用于预测蛋白-配体复合物,介绍、详细安装及使用
文章详细说明了安装步骤,包括配置conda环境、安装PyTorch及相关组件。本文介绍了2024年发表在Nature Machine Intelligence上的蛋白质-配体复合物预测模型NeuralPLexer。该模型由NVIDIA和MIT团队开发,能够仅通过蛋白质序列和配体分子输入直接预测复合物结构。NeuralPLexer包含三个核心模块:基于图的化学特征编码器、接触预测模块和等变结构去噪模块,实现了蛋白质-配体盲对接和结合位点结构恢复。
2025-12-20 20:39:49
903
原创 D-I-TASSER: 来自NUS张阳课题组,多结构域蛋白预测CASP排名第一
D-I-TASSER是一种结合深度学习和物理模拟的蛋白质结构预测方法,在CASP15盲测中表现优于AlphaFold2/3。该方法通过DeepMSA2构建多序列比对,利用DeepPotential等神经网络预测残基接触/距离,结合蒙特卡洛模拟构建结构模型,并创新性地引入域拆分重组模块处理多域蛋白。基准测试显示其单域蛋白预测TM-score达0.870,比传统方法提升108%;在多域蛋白中比AlphaFold2高12.9%。本文提供官网的安装使用方法以及初步测试。
2025-12-14 17:04:12
992
原创 BoltzGen: 安装与使用,来自MIT团队生成式人工智能开源模型用于大分子binder设计
本文汇总介绍了MIT团队带来的开源AI项目BoltzGen的原理和conda环境配置、命令行参数说明和简单使用体验。该项目完全开源,提供完整的模型权重、训练代码和使用工具链,包括和结果分BoltzGen是一种创新的全原子生成式扩散模型,专为设计蛋白质、肽和核酸结合剂而开发。该模型统一了结构预测和分子设计,支持针对各类生物靶标(包括蛋白质、核酸和小分子)的高亲和力结合剂生成。BoltzGen已通过大规模实验验证,成功设计出针对多种新型靶标的纳米抗体、微型蛋白等结合剂。
2025-11-10 17:45:00
1219
原创 AF3Complex: Georgia Tech团队优于AF3的改进版,用于蛋白复合物结构预测,详细安装及用法
本文介绍了AF3Complex在Linux Ubuntu的详细安装过程及使用记录。AF3Complex在AlphaFold 3的基础上进行了多项关键改进,使其在蛋白质复合物结构预测方面表现优异。AF3Complex不仅继承了先前AF2Complex的改进,还增加了一种新颖的排除配体的方法,使其在多种蛋白质复合物结构预测任务中显著优于AlphaFold 3。
2025-11-09 17:45:00
617
原创 SimpleFold: 苹果公司基于Transformer架构的蛋白质折叠开源模型,安装与体验
本文提供了苹果公司推出的开源蛋白结构折叠生成模型-SimpleFold的文章介绍、Linux系统下的安装及简单试用体验。SimpleFold是一种基于流匹配的新型蛋白质折叠生成模型,摒弃了传统方法中的多序列比对、成对表示和三角更新等复杂架构设计。该模型采用通用Transformer主干网络,通过简化架构实现高效结构预测,并支持从100M到3B不同规模的参数配置。实验表明,SimpleFold在CAMEO22和CASP14基准测试中性能接近甚至超越现有方法,同时显著降低了计算复杂度。
2025-11-08 17:45:00
2085
原创 Boltz-2: 安装及用法,来自麻省理工和AI制药公司 Recursion 的结构与亲和力预测模型,解决小分子药物发现的关键问题
该AI模型由麻省理工学院计算机科学与人工智能实验室与上市AI制药公司Recursion一起开发,双方在Boltz-1的基础之上,通过改进和拓展性能而来。简单来说,Boltz 与 AlphaFold3 一样,均是一种全原子共折叠模型,它将蛋白质折叠或结构预测的概念扩展到DNA、RNA、配体中。该模型不仅可以预测分子相互作用的 3D 结构,还可用于分子设计等下游任务。Boltz-2将亲和力预测与结构建模相结合,提高了预测结构的物理真实感。Boltz-2 在一个大型数据集上进行了训练,该数据集结合了500。
2025-06-14 14:38:58
3032
转载 ChemVLM: 首个开源多模态化学大模型, 从化学图片到化学文本信息
本文提出了ChemVLM,这是首个面向化学领域的开源多模态大型语言模型,旨在解决化学图像理解与文本分析之间的不兼容问题。该模型基于VIT-MLP-LLM架构,采用ChemLLM-20B作为基础大型模型,使模型在理解和利用化学文本知识方面具备了强大的能力。
2025-03-26 23:08:42
718
原创 分子动力学软件包Amber24的安装
Amber24 软件包在 AmberTools24 基础上添加了pmemd 程序,该程序类似于AmberTools 中的sander(分子动力学)代码,但在多个 CPU 上提供了(更)更好的性能,并在 GPU 上显著提高了速度。在机器上有安装多块GPU时,可以编译GPU并行版本(即调整 -DMPI=TRUE -DCUDA=TRUE ),实际使用中并不能带来显著的提升,不再展示安装效果。CPU串行版安装是基本配置,将不会安装支持并行的程序,即.MPI的后缀程序,适用于不强制使用CPU并行的场景。
2025-03-22 17:13:56
3664
1
原创 ChemEval: 面向化学领域大模型能力的多层次多维度评估框架
ChemEval 的开发基于一个核心理念:需要一个能够全面评估 LLMs 在化学领域能力的基准测试,它不仅能考察大模型对化学基础知识的掌握,还能评估在高级化学概念方面的理解和应用。目前尽管已经存在一些基准测试,如 MMLU 涵盖了包括化学在内的多个领域共 57 项测评任务,但这些测试大部分仅仅面向基础概念的问答,缺乏对化学领域更深层次能力的评估。在这项研究中建立了一个名为 ChemEval 的基准,专门用于评估化学领域内的大语言模型能力,以填补当前化学领域缺乏多层级、多维度任务体系测评基准的空白。
2025-03-09 09:10:58
1331
1
原创 SMI–TED: IBM推出专用于化学领域的大模型
2024年12月,IBM推出化学大模型SMI-TED(SMILES-based Transformer Encoder-Decoder):可精准预测分子性质和行为,标志着化学分子预测领域的一项重要技术进展。huggingface开原链接:核心架构:SMI-TED 的技术核心在于其深度双向变压器编码器架构。通过对 SMILES 字符串的精准解析,能够理解分子间复杂的关系。编码器负责将输入的分子信息转换为潜在的表征形式,解码器则根据这些信息逐步生成 SMILES 字符串,确保生成的分子信息准确且连贯。
2025-03-08 23:38:18
1118
原创 ChemLLM: 首个开源科学大模型“浦科化学”
转载介绍 首个开源科学大模型“浦科化学”-ChemLLM。这是一个全面的框架,特点是第一个专门针对化学领域的LLM(大型语言模型)。它还包括ChemData,一个专门为指令微调设计的dataset(数据集),以及ChemBench,一个涵盖九个基本化学任务的强大基准测试。ChemLLM擅长在化学学科中执行各种任务,并具有流畅的对话互动。值得注意的是,ChemLLM在核心化学任务上取得了与GPT-4相当的结果,并且在一般场景下表现出与相似大小的LLMs相当的竞争力。
2025-03-08 23:10:09
2089
1
原创 Windows系统本地部署DeepSeek-R1+本地知识库+联网搜索+Agent功能
本文记录了Windows11 + Ollama + AnythingLLM,3步快速本地部署DeepSeek-R1模型,支持联网搜索、应用本地知识库和创建Agent功能。
2025-02-22 16:53:18
1708
原创 Ubuntu系统3分钟本地部署DeepSeek-R1蒸馏模型,支持联网
DeepSeek-R1蒸馏模型的3步快速无痛安装与体验,Ubuntu + ollama + Page Assist,支持联网,支持API。
2025-02-20 21:57:40
1168
原创 AlphaFold v3.0.1 conda版本详细安装与使用
2024年11月11日,AlphaFold 3.0.0源代码正式对外开源,仅限非商业用途使用,提供docker版本的使用介绍。本文提供AlphaFold 3.0.1 conda版本的安装及使用方法。
2025-02-19 17:15:17
3806
3
原创 机器学习开源分子生成系列(2)-基于三维形状和静电相似性的DeepFMPO v3D安装及使用
本文是基于 3D 的分子生成方法DeepFMPO v3D的介绍及安装使用。
2024-07-11 17:45:00
1203
1
原创 OmegaFold: 蛋白结构预测深度神经网络模型安装、使用
OmegaFold的工作原理是将蛋白质的序列输入到一个深度神经网络模型中,该模型经过训练可以从序列中学习到蛋白质的结构信息。模型使用的是大量已知结构的蛋白质数据进行训练,并通过比对已知结构与预测结构之间的相似性来评估预测结果的准确性。
2024-04-04 20:08:56
2199
8
原创 Ubuntu系统Psi4 使用conda安装及编译安装
Psi4是一个量子化学软件包,用于计算分子和固体的电子结构。本文提供本地安装及在Python中使用的安装。以上就是今天要讲的内容,本文仅仅简单介绍了psi4安装方法,在后续的QM计算将使用到。
2024-03-17 20:37:56
2206
原创 开源分子对接程序rDock使用方法(2)-高通量虚拟筛选HTVS
rDock是一个快速、多功能的开源对接程序,可用于将小分子配体与蛋白质或核酸受体的对接;选用不同的对接模式可以完成考虑受体结合水的分子对接(Docking with explicit waters)以及药效团限制性对接(Docking with pharmacophore restraints),也可以用来做高通量虚拟筛选(HTVS)。本文介绍 rDock采用Multi-Step Protocol进行高通量虚拟筛选HTVS的流程及使用案例。
2024-03-13 19:50:02
1919
2
原创 生物分子体系结构预测开源模型RoseTTAFold All-Atom的conda环境部署及使用
本文提供了生物体系结构预测开源模型RoseTTAFold All-Atom的Conda安装及使用体验。
2024-03-12 10:46:42
5704
23
原创 机器学习开源分子生成系列(1)-DeepFrag的本地部署及使用
本文提供了开源程序DeepFrag的在本地conda版本的部署及使用方法,满足用户避免数据上传到web app使用的需求。
2024-03-08 13:30:28
2015
3
原创 开源分子对接程序rDock使用方法(1)-Docking in 3 steps
rDock是一个快速、多功能的开源对接程序,可用于将小分子配体与蛋白质或核酸受体的对接;选用不同的对接模式可以完成考虑受体结合水的分子对接(Docking with explicit waters)以及药效团限制性对接(Docking with pharmacophore restraints),也可以用来做高通量虚拟筛选(HTVS)。本文介绍 rDock用于受体-配体的标准对接(Docking in 3 steps),为研究其他模式下的分子对接打好基础。
2024-03-08 07:00:00
2677
2
原创 蛋白结构预测RoseTTAFold2的安装及使用
本文介绍了蛋白结构预测开源程序RoseTTAFold2的安装及使用体验。本文介绍了蛋白结构预测开源程序RoseTTAFold2的安装及使用体验,并在实例上与AlphaFold2和ESMFold的表现与耗时做了比较。
2024-03-07 07:00:00
6034
6
原创 Mol2文件处理-拆分、合并、提取名称、计数与格式转换
Mol2格式文件是常用的分子结构存储文件,可以在一个.Mol2文件中记录单个或多个分子的立体结构信息、电荷信息以及其他信息。本文介绍Mol2分子处理的常见操作,包括文件合并与拆分,分子名称修改,分子计数与变量传递等。
2024-03-06 07:00:00
3082
原创 UCSF DOCK 分子对接详细案例(05)- 遗传算法用于分子生成 DOCK_GA
本文是UCSF DOCK的使用案例分享,关于DOCK中基于配体-靶标相互作用的遗传算法用于分子生成,模块名称 DOCK_GA。利用进化原理的构建方法, 包括分子重组、突变和自然选择, 以指导与靶标有特定相互作用的配体的从头设计。DOCK_GA可用于:(1)生成与靶标具有特定相互作用的结构类似物;(2)作为从分子片段生长分子的从头设计方法;(3)作为筛选靶向结合位点分子的方法的补充。
2024-03-05 19:00:00
1633
原创 UCSF DOCK 分子对接详细案例(04)-基于RDKit描述符的分子从头设计DOCK_D3N
本文是UCSF DOCK的使用案例分享,我们将使用DOCK 6.11自带的片段库,使用DOCK/RDKit的 DOCK_D3N功能从头设计分子。在本实例中,我们使用DOCK的通用片段库,使用DOCK_D3N的方式,从头开始为我们的受体构建新的配体,这只是一个运行案例,在实际项目任务中,需要进一步优化加载的片段库、设置合适的片段生长方式、过滤条件等,不断生成接近预期的目标新分子。
2024-03-04 18:00:00
1790
2
原创 UCSF DOCK 分子对接详细案例(03)-分子从头设计de novo Design
本文是UCSF DOCK的使用案例分享,包括DOCK 6.11的de novo Design 模块包含的三项功能:(3)用户自定义生成片段库并实现Focused De Novo Design在本实例中,我们使用DOCK的通用片段库,从头开始为我们的受体构建新的配体;也使用DOCK片段数据库构建功能建立片段数据库用于分子生成。
2024-03-03 07:00:00
2184
1
原创 UCSF DOCK 分子对接详细案例(02)-并行用于高通量虚拟筛选
本文是UCSF DOCK的高通量虚拟筛选的使用案例分享,内容包括:(1)高通量虚拟筛选及数据库过滤;(2)对虚拟筛选结果进行能量最小化;(3)通过描述符等重新打分,综合排序。
2024-03-02 00:12:03
2309
原创 UCSF DOCK 分子对接详细案例(01)- rigid, fixed anchor, flexible dock
本文是UCSF DOCK的使用案例分享,包括:(1)配体、受体输入文件处理;(2)分子对接;(3)配体-受体相互作用中范德华与静电能量分解的指纹footprint。
2024-03-01 19:45:33
2349
Amber16+分子模拟与计算化学的软件+生物分子(如蛋白质、核酸)的动态模拟+药物设计+膜蛋白研究及能量计
2025-03-24
AmberTools17+分子模拟与计算化学+Amber分子动力学软件套件的重要组成部分+用于生物分子和生物大
2025-03-24
openmpi-1.10.0, 是一种开源的高性能消息传递接口(MPI)实现,属于高性能计算技术领域 它用于分布式内存系统中的并行计算,支持多种操作系统和网络互联
2025-03-24
Amber 14 Reference Manual-官方软件说明书
2025-03-24
Amber14 是一款用于分子模拟与计算化学的软件 它主要用于生物分子(如蛋白质、核酸)的动态模拟、药物设计、膜蛋白研究及能量计算等 支持 GPU 加速、QM/M等
2025-03-24
AmberTools14属于分子模拟与计算化学技术领域,是Amber分子动力学软件套件的重要组成部分 它主要用于生物分子和生物大分子的模拟与计算研究
2025-03-24
ucsf-chimerax-1.7.1ubuntu22.04-amd64.deb Ubuntu22版本
2024-03-03
UCSF DOCK 分子对接详细案例(04)-基于RDKit描述符的分子从头设计DOCK-D3N-输入文件.tar.xz
2024-03-03
分子作图、处理、可视化工具chimera-1.17.3-linux-x86-64.bin,Linux版本
2024-03-03
chimera-1.17.3-win64.exe 分子作图、处理、可视化工具Windows版本
2024-03-03
ChimeraX-1.7.1.exe 支持Windows 10 和Windows11
2024-03-03
UCSF DOCK 分子对接详细案例(03)-分子从头设计de novo Design.tar.xz
2024-03-02
UCSF DOCK分子对接 指纹查看python脚本 plot-footprint-single-magnitude.py
2024-03-01
计算化学+分子模拟+分子力场说明文档+TRIPOS,SYBYL
2024-02-28
Tripos Mol2 Format File,分子结构 mol2格式文件的详细介绍
2024-02-24
分子对接机器学习打分函数GB-score文章
2024-02-23
rDock Reference Guide.pdf
2024-02-17
Torque Resource Manager Administrator Guide 6.1.3
2024-02-17
Torque Resource Manager Administrator Guide 5.1.3
2024-02-16
ledock-hts-mod.sh
2024-02-08
这是AlphaFold运行bash脚本更新版本,适用于AF2.1及以后,新脚本名称run-alphafold23.sh
2024-02-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅