- 博客(43)
- 收藏
- 关注
转载 首个开源多模态化学大模型ChemVLM-从化学图片到化学文本信息
本文提出了ChemVLM,这是首个面向化学领域的开源多模态大型语言模型,旨在解决化学图像理解与文本分析之间的不兼容问题。该模型基于VIT-MLP-LLM架构,采用ChemLLM-20B作为基础大型模型,使模型在理解和利用化学文本知识方面具备了强大的能力。
2025-03-26 23:08:42
12
原创 分子动力学软件包Amber24的安装
Amber24 软件包在 AmberTools24 基础上添加了pmemd 程序,该程序类似于AmberTools 中的sander(分子动力学)代码,但在多个 CPU 上提供了(更)更好的性能,并在 GPU 上显著提高了速度。在机器上有安装多块GPU时,可以编译GPU并行版本(即调整 -DMPI=TRUE -DCUDA=TRUE ),实际使用中并不能带来显著的提升,不再展示安装效果。CPU串行版安装是基本配置,将不会安装支持并行的程序,即.MPI的后缀程序,适用于不强制使用CPU并行的场景。
2025-03-22 17:13:56
1217
原创 面向化学领域大模型能力的多层次多维度评估框架 ChemEval
ChemEval 的开发基于一个核心理念:需要一个能够全面评估 LLMs 在化学领域能力的基准测试,它不仅能考察大模型对化学基础知识的掌握,还能评估在高级化学概念方面的理解和应用。目前尽管已经存在一些基准测试,如 MMLU 涵盖了包括化学在内的多个领域共 57 项测评任务,但这些测试大部分仅仅面向基础概念的问答,缺乏对化学领域更深层次能力的评估。在这项研究中建立了一个名为 ChemEval 的基准,专门用于评估化学领域内的大语言模型能力,以填补当前化学领域缺乏多层级、多维度任务体系测评基准的空白。
2025-03-09 09:10:58
474
原创 IBM推出专用于化学领域的大模型SMI–TED
2024年12月,IBM推出化学大模型SMI-TED(SMILES-based Transformer Encoder-Decoder):可精准预测分子性质和行为,标志着化学分子预测领域的一项重要技术进展。huggingface开原链接:核心架构:SMI-TED 的技术核心在于其深度双向变压器编码器架构。通过对 SMILES 字符串的精准解析,能够理解分子间复杂的关系。编码器负责将输入的分子信息转换为潜在的表征形式,解码器则根据这些信息逐步生成 SMILES 字符串,确保生成的分子信息准确且连贯。
2025-03-08 23:38:18
486
原创 首个开源科学大模型“浦科化学”-ChemLLM
转载介绍 首个开源科学大模型“浦科化学”-ChemLLM。这是一个全面的框架,特点是第一个专门针对化学领域的LLM(大型语言模型)。它还包括ChemData,一个专门为指令微调设计的dataset(数据集),以及ChemBench,一个涵盖九个基本化学任务的强大基准测试。ChemLLM擅长在化学学科中执行各种任务,并具有流畅的对话互动。值得注意的是,ChemLLM在核心化学任务上取得了与GPT-4相当的结果,并且在一般场景下表现出与相似大小的LLMs相当的竞争力。
2025-03-08 23:10:09
761
原创 Windows系统本地部署DeepSeek-R1+本地知识库+联网搜索+Agent功能
本文记录了Windows11 + Ollama + AnythingLLM,3步快速本地部署DeepSeek-R1模型,支持联网搜索、应用本地知识库和创建Agent功能。
2025-02-22 16:53:18
1219
原创 Ubuntu系统3分钟本地部署DeepSeek-R1蒸馏模型,支持联网
DeepSeek-R1蒸馏模型的3步快速无痛安装与体验,Ubuntu + ollama + Page Assist,支持联网,支持API。
2025-02-20 21:57:40
926
原创 AlphaFold v3.0.1 conda版本详细安装与使用
2024年11月11日,AlphaFold 3.0.0源代码正式对外开源,仅限非商业用途使用,提供docker版本的使用介绍。本文提供AlphaFold 3.0.1 conda版本的安装及使用方法。
2025-02-19 17:15:17
1593
2
原创 机器学习开源分子生成系列(2)-基于三维形状和静电相似性的DeepFMPO v3D安装及使用
本文是基于 3D 的分子生成方法DeepFMPO v3D的介绍及安装使用。
2024-07-11 17:45:00
1056
1
原创 蛋白结构预测OmegaFold的安装及使用
OmegaFold的工作原理是将蛋白质的序列输入到一个深度神经网络模型中,该模型经过训练可以从序列中学习到蛋白质的结构信息。模型使用的是大量已知结构的蛋白质数据进行训练,并通过比对已知结构与预测结构之间的相似性来评估预测结果的准确性。
2024-04-04 20:08:56
1414
8
原创 Ubuntu系统Psi4 使用conda安装及编译安装
Psi4是一个量子化学软件包,用于计算分子和固体的电子结构。本文提供本地安装及在Python中使用的安装。以上就是今天要讲的内容,本文仅仅简单介绍了psi4安装方法,在后续的QM计算将使用到。
2024-03-17 20:37:56
1736
原创 开源分子对接程序rDock使用方法(2)-高通量虚拟筛选HTVS
rDock是一个快速、多功能的开源对接程序,可用于将小分子配体与蛋白质或核酸受体的对接;选用不同的对接模式可以完成考虑受体结合水的分子对接(Docking with explicit waters)以及药效团限制性对接(Docking with pharmacophore restraints),也可以用来做高通量虚拟筛选(HTVS)。本文介绍 rDock采用Multi-Step Protocol进行高通量虚拟筛选HTVS的流程及使用案例。
2024-03-13 19:50:02
1471
2
原创 生物分子体系结构预测开源模型RoseTTAFold All-Atom的conda环境部署及使用
本文提供了生物体系结构预测开源模型RoseTTAFold All-Atom的Conda安装及使用体验。
2024-03-12 10:46:42
4795
23
原创 机器学习开源分子生成系列(1)-DeepFrag的本地部署及使用
本文提供了开源程序DeepFrag的在本地conda版本的部署及使用方法,满足用户避免数据上传到web app使用的需求。
2024-03-08 13:30:28
1701
3
原创 开源分子对接程序rDock使用方法(1)-Docking in 3 steps
rDock是一个快速、多功能的开源对接程序,可用于将小分子配体与蛋白质或核酸受体的对接;选用不同的对接模式可以完成考虑受体结合水的分子对接(Docking with explicit waters)以及药效团限制性对接(Docking with pharmacophore restraints),也可以用来做高通量虚拟筛选(HTVS)。本文介绍 rDock用于受体-配体的标准对接(Docking in 3 steps),为研究其他模式下的分子对接打好基础。
2024-03-08 07:00:00
2019
2
原创 蛋白结构预测RoseTTAFold2的安装及使用
本文介绍了蛋白结构预测开源程序RoseTTAFold2的安装及使用体验。本文介绍了蛋白结构预测开源程序RoseTTAFold2的安装及使用体验,并在实例上与AlphaFold2和ESMFold的表现与耗时做了比较。
2024-03-07 07:00:00
4253
6
原创 Mol2文件处理-拆分、合并、提取名称、计数与格式转换
Mol2格式文件是常用的分子结构存储文件,可以在一个.Mol2文件中记录单个或多个分子的立体结构信息、电荷信息以及其他信息。本文介绍Mol2分子处理的常见操作,包括文件合并与拆分,分子名称修改,分子计数与变量传递等。
2024-03-06 07:00:00
2328
原创 UCSF DOCK 分子对接详细案例(05)- 遗传算法用于分子生成 DOCK_GA
本文是UCSF DOCK的使用案例分享,关于DOCK中基于配体-靶标相互作用的遗传算法用于分子生成,模块名称 DOCK_GA。利用进化原理的构建方法, 包括分子重组、突变和自然选择, 以指导与靶标有特定相互作用的配体的从头设计。DOCK_GA可用于:(1)生成与靶标具有特定相互作用的结构类似物;(2)作为从分子片段生长分子的从头设计方法;(3)作为筛选靶向结合位点分子的方法的补充。
2024-03-05 19:00:00
1417
原创 UCSF DOCK 分子对接详细案例(04)-基于RDKit描述符的分子从头设计DOCK_D3N
本文是UCSF DOCK的使用案例分享,我们将使用DOCK 6.11自带的片段库,使用DOCK/RDKit的 DOCK_D3N功能从头设计分子。在本实例中,我们使用DOCK的通用片段库,使用DOCK_D3N的方式,从头开始为我们的受体构建新的配体,这只是一个运行案例,在实际项目任务中,需要进一步优化加载的片段库、设置合适的片段生长方式、过滤条件等,不断生成接近预期的目标新分子。
2024-03-04 18:00:00
1500
2
原创 UCSF DOCK 分子对接详细案例(03)-分子从头设计de novo Design
本文是UCSF DOCK的使用案例分享,包括DOCK 6.11的de novo Design 模块包含的三项功能:(3)用户自定义生成片段库并实现Focused De Novo Design在本实例中,我们使用DOCK的通用片段库,从头开始为我们的受体构建新的配体;也使用DOCK片段数据库构建功能建立片段数据库用于分子生成。
2024-03-03 07:00:00
1900
1
原创 UCSF DOCK 分子对接详细案例(02)-并行用于高通量虚拟筛选
本文是UCSF DOCK的高通量虚拟筛选的使用案例分享,内容包括:(1)高通量虚拟筛选及数据库过滤;(2)对虚拟筛选结果进行能量最小化;(3)通过描述符等重新打分,综合排序。
2024-03-02 00:12:03
1626
原创 UCSF DOCK 分子对接详细案例(01)- rigid, fixed anchor, flexible dock
本文是UCSF DOCK的使用案例分享,包括:(1)配体、受体输入文件处理;(2)分子对接;(3)配体-受体相互作用中范德华与静电能量分解的指纹footprint。
2024-03-01 19:45:33
1770
原创 UCSF DOCK 6.11安装并行与RDKit功能
2023年更新的UCSF DOCK 6.11版本增加了新功能,可以使用RDKit描述符及基于描述符的全新分子设计(descriptor-driven de novo design),本文介绍 了DOCK 6.11在本地的安装,为分子对接和高通量虚拟筛选做准备。
2024-02-28 16:00:26
1503
1
原创 蛋白结构预测模型评价指标
本文汇总了AlphaFold和AlphaFold-multimer等蛋白结构推理预测中,不同蛋白结构预测模型的评价指标。供大家参考。
2024-02-26 22:18:56
9451
3
原创 机器学习打分函数在分子对接中的应用系列-GB_Score
基于机器学习和深度学习构建打分函数,可以预测对接过程中生成的蛋白质-配体位姿或晶体复合物的结合得分,已成为CADD领域一个活跃的研究命题。GB-Score是一种最先进的基于机器学习的评分函数,利用PDBbind-v2019 general sets作为数据集,使用距离加权的原子间接触特征和梯度提升树算法来预测结合亲和力。GB-Score在CASF-2016基准测试中的得分能力指标非常优异,实现Pearson相关性0.862和RMSE 1.190
2024-02-25 18:21:34
1929
2
原创 化学分子Mol2文件格式与使用注意事项
Mol2格式文件是一个ASCII 文件,由Tripos公司编制的用于表示化学分子的文件格式,在其药物设计软件套装SYBYL中使用。Mol2格式文件被分子模拟的众多软件所支持,包括计算化学、分子对接,分子动力学软件,如Gaussian,VMD,UCSF DOCK,rDock,LeDock,MOE,Schrodinger,Openbabel,RDKit,Amber,Gromacs等。本文介绍了Mol2文件格式。
2024-02-24 23:31:28
4173
原创 基于生成扩散模型的分子对接程序-DiffDock安装及使用
分子对接是采用计算模拟的方式,预测受体与配体之间的结合模式,即Pose,以便于后续的Pose评估(打分)。传统对接基于构象搜索,深度学习将分子对接抽象为回归问题,但都没有很好的解决对接准确性问题。DiffDock来自MIT CSAIL的Regina教授和Tommi教授课题组的工作,他们将分子对接视为一种生成任务,并采用了时下在图像生成等领域相当热门的生成扩散模型(DGM)。
2024-02-23 18:00:00
4507
13
原创 开源分子对接程序rDock的安装及使用流程
本文介绍了rDock的两种安装方式及使用流程,为开始使用rDock的朋友提供参考以及快速入门指导。后续系列文章将结合案例详细介绍rDock使用。
2024-02-22 18:00:00
3391
1
原创 ESMFold conda安装、使用及与AlphaFold的简单比较
ESMFold 是一款由 Meta AI 团队开发的高精度蛋白质结构预测工具。相较于其他蛋白质结构预测方法,例如 AlphaFold2 和 RoseTTAFold,ESMFold 具备更快的预测速度。(1)ESMFold官方提供安装指引较为繁琐,本文提供了conda版本的快速便捷安装方法。(2)通过案例介绍ESMFold单个结构序列和批量结构序列的预测方法。
2024-02-20 15:30:32
7343
26
原创 化学空间可视化(chemical space visualization)开源软件ChemPlot的安装及使用
数据可视化提供了将高维分子数据减少到二维(2D)或三维(3D)空间的实用手段。在低维化学空间中的数据的视觉检查使得能够更真实地筛选具有用户期望的性质的分子,用于化学库设计,高通量筛选,多样性分析和离群值检测。本文介绍开源化学空间可视化工具ChemPlot从conda环境在本地安装及使用方法,避免化学信息数据上传,帮助化学工作者使用不同的降维方法可视化数据库。
2024-02-19 19:00:00
2245
1
原创 分子对接软件UCSF DOCK的新功能介绍及安装
本文介绍分子对接软件UCSF DOCK的新功能及在Linux上安装,后续将结合案例介绍具体使用方法。
2024-02-18 19:00:12
1919
1
原创 Ubuntu22.04上作业调度管理软件PBS Torque的安装、配置及主要使用方法
PBS Torque作为一种开源的作业调度和资源管理系统,广泛用于高性能计算环境中。它提供了一个集中式的作业调度器,可以有效地管理计算集群中的作业,并将它们分配给可用的资源。Torque目前最新版本为7.0.1,本文将介绍Linux Ubuntu 22.04上PBS Torque 6.1.3的安装、配置及主要使用方法。以上是PBS Torque 6.1.3在Ubuntu22.04上的安装、基本配置和使用方法。
2024-02-17 19:00:00
5500
7
原创 Linux系统MPI library之OpenMPI的安装及使用
OpenMPI是一个开源的消息传递接口(Message Passing Interface,MPI)的实现,用于并行计算。它允许多个计算节点之间进行通信和数据交换,从而实现分布式计算。这里介绍OpenMPI的安装和基本使用。安装是后续的分子对接虚拟筛选以及分子动力学研究的准备工作。
2024-02-15 19:30:20
7270
1
原创 开源分子对接软件Ledock之--CPU并行用于虚筛选
LeDock是一款开源分子对接软件,过往的对比研究显示LeDock在配体构象生成和打分上具有比较优势,从使用上看对接计算速度亦具有明显优势。LeDock默认使用单线程CPU计算分子对接任务,单机使用对当前多核心多线程的CPU利用不够。本文介绍采用GNU parallel并行计算以及使用Slurm提交任务提高CPU利用率,实现高通量虚拟筛选,适合单机及HPC。过往使用案例中,100个线程的机器每天可实现30~50万+小分子数据库的虚拟筛选,每天可以完成一个靶点在Specs数据库上的虚拟筛选工作。
2024-02-12 13:19:32
2507
1
原创 Linux 并行GNU parallel的安装及主要使用方法
本文介绍了GNU parallel的Linux安装及主要使用方法,为实现CPU并行处理任务做准备。GNU Parallel是一个shell工具,为了在一台或多台计算机上并行的执行计算任务,一个计算任务可以是一条shell命令或者一个以每一行做为输入的脚本程序。
2024-02-09 07:00:00
6314
3
原创 开源分子对接软件LeDock之--在单机上快速部署及使用
本文介绍开源分子对接软件LeDock在Linux Ubuntu上快速便捷安装及简易使用
2024-02-07 18:00:00
2458
1
Amber16+分子模拟与计算化学的软件+生物分子(如蛋白质、核酸)的动态模拟+药物设计+膜蛋白研究及能量计
2025-03-24
AmberTools17+分子模拟与计算化学+Amber分子动力学软件套件的重要组成部分+用于生物分子和生物大
2025-03-24
openmpi-1.10.0, 是一种开源的高性能消息传递接口(MPI)实现,属于高性能计算技术领域 它用于分布式内存系统中的并行计算,支持多种操作系统和网络互联
2025-03-24
Amber 14 Reference Manual-官方软件说明书
2025-03-24
Amber14 是一款用于分子模拟与计算化学的软件 它主要用于生物分子(如蛋白质、核酸)的动态模拟、药物设计、膜蛋白研究及能量计算等 支持 GPU 加速、QM/M等
2025-03-24
AmberTools14属于分子模拟与计算化学技术领域,是Amber分子动力学软件套件的重要组成部分 它主要用于生物分子和生物大分子的模拟与计算研究
2025-03-24
ChimeraX-1.7.1.exe 支持Windows 10 和Windows11
2024-03-03
ucsf-chimerax-1.7.1ubuntu22.04-amd64.deb Ubuntu22版本
2024-03-03
chimera-1.17.3-win64.exe 分子作图、处理、可视化工具Windows版本
2024-03-03
分子作图、处理、可视化工具chimera-1.17.3-linux-x86-64.bin,Linux版本
2024-03-03
UCSF DOCK 分子对接详细案例(04)-基于RDKit描述符的分子从头设计DOCK-D3N-输入文件.tar.xz
2024-03-03
UCSF DOCK 分子对接详细案例(03)-分子从头设计de novo Design.tar.xz
2024-03-02
UCSF DOCK分子对接 指纹查看python脚本 plot-footprint-single-magnitude.py
2024-03-01
计算化学+分子模拟+分子力场说明文档+TRIPOS,SYBYL
2024-02-28
Tripos Mol2 Format File,分子结构 mol2格式文件的详细介绍
2024-02-24
分子对接机器学习打分函数GB-score文章
2024-02-23
rDock Reference Guide.pdf
2024-02-17
Torque Resource Manager Administrator Guide 6.1.3
2024-02-17
Torque Resource Manager Administrator Guide 5.1.3
2024-02-16
ledock-hts-mod.sh
2024-02-08
这是AlphaFold运行bash脚本更新版本,适用于AF2.1及以后,新脚本名称run-alphafold23.sh
2024-02-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人