ManonLegrand
I ain't never backin' down (come and step in the plate).
For my city for my town (I'll do whatever it takes).
展开
-
AI4S - 《人工智能与药物设计》药物设计相关数据库的概述 (1)
药物设计是指使用化学、生物学、分子生物学等方法,对于已知的药物或天然产物进行改造或创新,以提高其药理活性、安全性和生物利用度的过程。药物设计是新药开发的重要环节,也是医药行业的核心竞争力之一。在药物发现与药物设计领域中,包括三类的数据库资源。原创 2024-06-04 15:17:16 · 343 阅读 · 0 评论 -
AI4S - 开源工具 FreeSASA 计算 蛋白质复合物 链间接触面积 教程
在蛋白质复合物中,通过链间距离,可以计算出在接触面的残基与接触面的面积,使用 BioPython 库 与 SASA (Solvent Accessible Surface Area,溶剂可及表面积) 库。SASA 计算主要以 水分子 是否通过为基础,水分子的半径是1.4 A,直径是 2.8 A,所以以 2.8 A 的距离,判断链间是否连接。原创 2024-06-03 16:36:23 · 386 阅读 · 0 评论 -
AI4S - 开源网站 MolProbity 评估蛋白质结构的原子冲突(Clash) 教程
MolProbity 是由杜克大学生物化学系开发的在线工具,主要用于蛋白质结构分析。可以帮助研究人员评估和改进蛋白质晶体结构的质量,也可以用于评估蛋白质结构冲突。原创 2024-05-27 16:48:23 · 708 阅读 · 0 评论 -
AI4S - 开源工具 Amber 松弛(Relax) 蛋白质三维结构 (Python) 教程
Amber 工具在蛋白质松弛(Relax)过程中起着重要的作用。在分子动力学模拟中,蛋白质松弛是指模拟过程中蛋白质结构达到一个较为稳定的状态。这个过程通常涉及能量最小化和温度平衡,以确保蛋白质的结构和动态行为接近其在生物体内的自然状态。原创 2024-05-27 15:21:53 · 286 阅读 · 0 评论 -
AI4S - 开源 RoseTTAFoldNA 蛋白质与核酸 复合物结构预测 教程
蛋白质与核酸复合物 (Protein and Nucleic Acid Complex),在生物学中发挥着关键作用。 在蛋白质的结构预测领域,已经取得一些进展,但是,在蛋白质与核酸复合物的结构预测领域,在很大程度上,仍是尚未解决的问题。RoseTTAFold2NA 将 RoseTTAFold 的端到端深度学习框架,扩展至核酸、蛋白质与核酸复合物的建模。通过已训练的 RoseTTAFoldNA 模型,快速生成 3D 结构,同时,对于 蛋白质与DNA、蛋白质与RNA、RNA 三级结构,进行置信估计。 在原创 2024-05-27 14:40:09 · 300 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》小分子/蛋白质/核酸的数据表征 概述 (2)
小分子化合物、蛋白质、核酸之间的关联是生命科学研究的一个重要领域,涉及到细胞功能的调控、信号传导的机制、疾病的发生和治疗等方面。因此,这些分子的 数据表征(Data Representation) 方式,作为深度学习算法的训练数据。原创 2024-05-27 11:52:08 · 290 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》基于 AIDD 的药物靶点发现与识别 概述 (3)
药物的靶点识别是指通过生物信息学、化学信息学、分子生物学等方法,从大量的候选靶点中筛选出与某一疾病相关的有效靶点,从而为药物设计提供依据。原创 2024-05-24 14:58:05 · 266 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》蛋白质/核酸/小分子 的结构预测 概述 (4)
生物结构预测是指根据生物分子的序列信息,推断其在空间中的三维形状和排列。生物结构预测对于理解生物分子的功能、相互作用、进化和设计具有重要意义。生物结构预测的对象主要包括蛋白质、核酸和小分子。原创 2024-04-17 21:26:17 · 250 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》量子化学与分子力场 概述 (5)
量子化学和分子力场都是计算化学中常用的方法,可以用来进行几何优化、振动分析、分子动力学模拟、蒙特卡罗方法等任务。 量子化学和分子力场的区别在于,量子化学是从头算或半从头算的方法,基于物理原理,精度高但耗时大;分子力场是经验的方法,基于实验数据,精度低但耗时小。 量子化学和分子力场的选择取决于研究的目的、体系的大小和复杂度、可用的计算资源等因素。原创 2024-04-16 18:42:13 · 419 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》小分子药物生成与从头设计 概述 (6)
小分子药物生成是一种利用计算方法自动探索化学空间,寻找具有理想生物活性和药物特性的分子结构的过程。从头设计是一种特殊的小分子药物生成方法,不依赖于已知的化合物库,而是完全从零开始构建分子。从头设计的方法可以分为基于原子、基于片段和基于反应的三种类型,根据分子表示的粒度和复杂度进行区分。基于原子的方法是通过逐步添加原子和键来构建分子,基于片段的方法是通过拼接预先定义的化学片段来构建分子,基于反应的方法是通过模拟化学反应来构建分子。从头设计的方法可以结合人工智能和深度学习技术,以提高分子生成的效率和质量。原创 2024-04-16 14:48:48 · 179 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》小分子药物设计与优化 概述 (7)
小分子药物设计与优化是一门不断发展和创新的学科,随着新技术和新方法的出现,如RNA靶向、人工智能、机器学习等,为小分子药物的发现和开发提供了新的思路和手段。原创 2024-04-08 12:49:47 · 326 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》大环类/蛋白质多肽/核酸 药物设计 概述 (8)
大分子药物设计领域主要包括3个方面,即大环类药物设计、蛋白质与多肽类药物设计、核酸药物设计等原创 2024-04-03 15:56:26 · 407 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》药物设计 ADMET 性质预测 概述 (9)
ADMET,即 Absorption、Distribution、Metabolism、Excretion、Toxicity,吸收、分布、代谢、排泄、毒性,这些性质对于药物的疗效和安全性有重要的影响。因此,在药物开发的早期阶段,就能依据化合物的 ADMET 性质,对于先导化合物进行有针对性的选取和优化,是非常必要的。然而,实验评估 ADMET 性质是耗时、耗费和有限的,因此,利用机器学习或深度学习等计算方法来预测 ADMET 性质,是一种有效的替代方案。原创 2024-04-02 15:48:41 · 230 阅读 · 0 评论 -
AI4S - 《人工智能与药物设计》药物晶型预测与剂型设计 概述 (10)
药物晶型预测与剂型设计是指利用计算机模拟和优化药物分子在固态形式下的结构、性质和稳定性,以及与制剂工艺和质量的关系,从而为药物开发和生产提供指导和支持。这是一个涉及多学科的前沿领域,具有重要的理论和实际意义。药物晶型预测与剂型设计是一个复杂的系统工程,目前还存在一些难点和挑战。原创 2024-03-28 11:21:24 · 478 阅读 · 0 评论 -
AI4S - 基于 蛋白质结构 的 层次聚类(Agglomerative Cluster) 算法 教程
Agglomerative Clustering,即聚集层次聚类,属于层次聚类算法,通过逐步合并或聚集数据点,构建嵌套的聚类。核心思想是将每个数据点视为一个单独的簇,然后,逐步合并最相似的簇,直到满足某种停止准则。这种相似性的度量通常基于距离或密度,例如欧几里得距离、余弦相似度等。该算法采用自底向上的方式构建聚类层次,将每个数据点作为单个聚类开始,然后,迭代合并最接近的聚类对,直到所有数据点合并为一个聚类,或直到达到指定的聚类数量为止。原创 2024-03-27 15:22:36 · 434 阅读 · 0 评论 -
AI4S - CombFold: Predicting Structures of Large Protein Assemblies 论文简读 (1)
CombFold 算法,用于预测大型蛋白质复合物的结构,利用由 AlphaFold2 预测的亚基之间的成对相互作用。尽管大型蛋白质复合物的预测,仍然具有挑战性,但是 CombFold 在两个包含 60 个大型非对称组装的数据集中准确地预测了 72% 的复合物(TM分数>0.7)。此外,与相应的 PDB 条目相比,预测的复合物的结构覆盖率提高了 20%。CombFold 还支持基于交联质谱的距离约束集成和可能复合物计量的快速枚举,其高准确性使其成为扩展单体蛋白质结构覆盖范围的有前途的工具。原创 2024-03-25 18:27:40 · 760 阅读 · 0 评论 -
AI4S - CombFold: Predicting Structures of Large Protein Assemblies 环境配置 (2)
CombFold 流程,从复合物中链的序列开始,预测大型蛋白质复合物的结构 (最多包含18000个氨基酸和32个亚基)。该流程使用 AlphaFold-Multimer (AFM) 来预测 可能的亚基复合物 的结构,这些亚复合物是目标复合物的亚基的组合。CombFold 组合装配算法,将这些结构组装成一个单一的大型复合物。原创 2024-03-06 10:59:45 · 523 阅读 · 0 评论 -
AI4S - CombFold: Predicting Structures of Large Protein Assemblies 推理流程 (3)
CombFold 是一种新的组装技术,可以利用 AlphaFold-Multimer 预测的可能的亚复合物的结构,来构建大型蛋白质复合物的结构。原创 2024-03-04 00:07:12 · 527 阅读 · 0 评论 -
AI4S - CombFold: 开源项目 大型蛋白质复合物组装 的完整流程 教程 (4)
CombFold 是用于预测大型蛋白质复合物结构的组合和分层组装算法,利用 AlphaFold 预测的亚基之间的成对相互作用。原创 2024-03-03 21:42:13 · 1215 阅读 · 0 评论 -
AI4S - CombFold: 开源项目 大型蛋白质复合物组装 的精简流程 教程 (5)
蛋白质组合装配 (Combinatorial Assembly) 是用于预测大型蛋白质复合物结构的算法,利用 AlphaFold 预测的亚基之间的成对相互作用,通过组合和层次化的方式,逐步构建出复合物的整体结构。原创 2024-02-27 11:53:09 · 1145 阅读 · 0 评论 -
AI4S - CombFold: 开源项目 大型蛋白质复合物组装 的自定义流程 教程 (6)
CombFold 是用于预测大型蛋白质复合物结构的组合和分层组装算法,使用 AlphaFold 预测的亚基之间的成对相互作用。原创 2024-02-26 16:30:11 · 1122 阅读 · 0 评论 -
AI4S - AlphaFlow: AlphaFold Meets Flow Matching for Generating Protein Ensembles 论文简读 (1)
蛋白质的生物功能通常依赖于动态的结构集合。在这项工作中,开发一种基于流的生成模型方法,用于学习和采样蛋白质的构象景观。重新利用诸如AlphaFold和ESMFold这样的高精度单态预测器,并在自定义的流匹配框架下对它们进行微调,以获得称为AlphaFLOW和ESMFLOW的序列条件生成蛋白质结构模型。原创 2024-02-20 15:08:52 · 729 阅读 · 0 评论 -
AI4S - AlphaFlow: AlphaFold Meets Flow Matching for Generating Protein Ensembles 工程配置 (2)
AlphaFlow 是基于流的生成模型方法,用于学习和采样蛋白质的构象景观。这项工作,使用类似 AlphaFold 和 ESMFold 这样的高精度单态预测器,并且,在自定义的流匹配框架下,进行微调,以获得称为A lphaFlow 和 ESMFlow 的序列条件生成模型。在 PDB 上进行训练和评估,与 AlphaFold 结合 MSA 子采样相比,AlphaFlow 在精确度和多样性上,提供了更优的组合。原创 2024-02-20 13:07:35 · 1196 阅读 · 0 评论 -
AI4S - AlphaFlow: AlphaFold Meets Flow Matching for Generating Protein Ensembles 训练流程 (3)
AlphaFlow 是基于流的生成建模方法,用于学习和采样蛋白质的构象景观,利用 AlphaFold 和 ESMFold 高精度单态预测器,并且,在自定义的流匹配框架下,进行微调,从而得到序列条件生成模型。在 PDB 上的训练和评估,显示出比 AlphaFold 结合 MSA 子采样更优越的精确度和多样性。进一步,在全原子 分子动力学(MD) 的集合上训练时,能够准确捕捉到未见蛋白质的构象灵活性、位置分布和更高阶的集合观测值。原创 2024-02-19 14:50:03 · 1022 阅读 · 0 评论 -
AI4S - AlphaFlow: PyTorchLightning+DeepSpeed 分布式训练配置 教程 (4)
目前,AlphaFlow 项目不支持 Multi GPU 运行,需要修改 PyTorch Lightning 框架,集成 DeepSpeed 等分布式策略。PyTorch Lightning 和 DeepSpeed 的组合使用,可以为深度学习项目,带来显著的训练速度提升和内存优化。原创 2024-02-19 11:09:49 · 941 阅读 · 0 评论 -
AI4S - AlphaFold: 使用 自定义复合物(Multimer)模版 预测蛋白质结构 教程 (2)
蛋白质结构模板是 AlphaFold 预测蛋白质三维结构的关键组成部分,充当了知识库的角色,帮助模型更好地理解蛋白质的折叠方式。原创 2024-02-18 15:47:33 · 1010 阅读 · 0 评论 -
AI4S - AlphaFold: 使用 自定义模版(Template) 预测蛋白质结构 教程 (1)
在 AlphaFold 中,模板(Template)的作用,是提供已知的蛋白质结构作为参考,以帮助预测目标蛋白质的三维结构。AlphaFold2 会从多个数据库中搜索并选择最合适的模板,或者使用自定义的模板。这些模板与目标蛋白质序列的对齐信息一起,被用来预测其三维结构。模板在 AlphaFold 中扮演着重要角色,为蛋白质三维结构预测提供了一个起点和参考框架,从而提高预测的准确性和效率。原创 2024-02-17 22:56:30 · 1092 阅读 · 0 评论 -
AI4S - AlphaFold: 使用 多个数据源 MSAs 预测蛋白质结构 教程 (3)
在蛋白质复合物结构预测时,需要实验不同的 MSAs 来源,有些 MSAs 与 AFM (AlphaFold2 Multimer) 的格式不相同,需要优化 AFM 结构预测框架,适配这种情况。原创 2024-02-09 19:26:35 · 950 阅读 · 0 评论 -
AI4S - AlphaFold: 使用 自定义 MSA+Template 预测蛋白质结构 教程 (4)
AlphaFold 是蛋白质结构预测算法,使用 MSA(多序列比对) 特征和 Template(模版) 特征,来提高预测的准确性。原创 2024-02-02 23:46:32 · 1234 阅读 · 0 评论 -
AI4S - AlphaFold: 多次 循环(Recycle)迭代 预测蛋白质结构 教程 (5)
高精度的蛋白质结构对于理解生物问题具有极其重要的意义。蛋白质是生物体内执行多种功能的基本分子,其结构决定了其功能。蛋白质的三维结构可以帮助科学家理解,其如何执行特定的生物学任务。许多疾病,包括遗传性疾病和感染性疾病,都与蛋白质结构异常或功能失常有关,通过研究蛋白质结构,可以揭示疾病发生的分子机制。蛋白质结构信息是药物设计的基础。通过药物靶标蛋白的结构,可以设计出能够精确结合并调节其活性的小分子药物。蛋白质结构的比较,可以帮助科学家理解不同物种之间的进化关系,以及在进化过程中蛋白质功能的变化。原创 2024-02-02 18:47:55 · 1068 阅读 · 0 评论 -
AI4S - 蛋白质结构文件 PDB 转换 mmCIF 格式 (Python) 教程
蛋白质的三维结构信息,通过两种格式的文件来获取:PDB (Protein Data Bank) 和 mmCIF (Macromolecular Crystallographic Information File,大分子晶体学信息文件) 。原创 2024-02-01 15:19:04 · 1035 阅读 · 0 评论 -
AI4S - 交联质谱 (Crosslinks) 的常见数据格式说明
交联质谱 (Crosslinking Mass Spectrometry,Crosslinks) 技术 是一种结合化学交联剂和质谱仪的方法,用于研究蛋白质或蛋白质复合物的空间结构和相互作用。交联质谱技术的基本原理是,通过使用带有两个或多个反应性基团的化学交联剂,将空间距离在交联剂臂长范围内的两个氨基酸通过稳定的共价键连接起来,形成交联肽段。原创 2024-02-01 14:22:46 · 925 阅读 · 0 评论 -
AI4S - 提取 UniRef 数据库的 MSA 序列物种 (Species) 信息 教程
UniRef序列中的物种(Species)信息:指每个聚类的代表性序列所属的物种,可以帮助用户了解聚类的生物学背景和多样性。物种信息是根据代表性序列的 UniProtKB 或 UniParc 条目中的物种注释获取的。如果一个聚类包含多个物种,那么物种信息会显示为“多物种聚类”。原创 2024-01-30 12:46:15 · 1043 阅读 · 0 评论 -
AI4S - Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion Bridge 简读
Re-Dock 提出 扩散桥(Diffusion Bridge) 生成模型,能够同时预测配体和口袋侧链的姿势,以反映能量约束的对接生成过程。分子对接是一项对于药物设计至关重要的任务,涉及预测蛋白质-配体复合物的构象。原创 2024-01-23 20:43:30 · 583 阅读 · 0 评论 -
AI4S - AFM-RL: Large Protein Complex Docking Using AlphaFold-Multimer and Reinforcement Learning 简读
生物细胞中的许多生物过程是由蛋白质复合物完成的,相互作用可以跨越多个蛋白质结构。要理解这些过程的分子机制,了解这些复合物的四级结构是至关重要的。尽管许多蛋白质复合物的结构,已经通过生物物理实验确定,但仍有许多重要的复合物结构尚未确定,特别是对于具有多条链的大型复合物。为了补充实验结构测定,已经开发了许多计算蛋白质对接方法,但大多数方法仅限于两条链,很少有方法针对三条或更多条链设计。原创 2024-01-19 16:59:17 · 1264 阅读 · 0 评论 -
AI4S - 转角密度估计器 RDE (Rotamer Density Estimator) 算法 简读
RDE(Rotamer Density Estimator,转角密度估计器),用于预测氨基酸突变对蛋白质-蛋白质相互作用的影响,利用基于流的生成模型,来估计蛋白质侧链构象的概率分布,并且用熵来衡量柔性。RDE只需要蛋白质结构作为输入,不需要实验数据的监督。此外,RDE提取的无监督表示还可以用于下游的神经网络预测,以获得更高的准确度。RDE在预测突变对结合自由能的变化(∆∆G)方面,优于经验能量函数和其他机器学习方法。原创 2024-01-13 12:48:32 · 589 阅读 · 0 评论 -
AI4S - 预测异源多聚体相互作用 Effective Virial Coefficient (有效节流系数) 算法 简读
Effective Virial Coefficient 构建 有效的异聚合物相互作用的理论,通过,将其拟合到对人类蛋白质无序区域序列的 200 多个样本进行的分子动力学模拟结果。两个异聚合物之间的氨基酸对相互作用之和,可以定性地很好地 预测 Boyle 温度,这可以通过二聚体对近似得到定量的改进,其中包含了序列中相邻氨基酸的效应改进的理论,结合了一个捕捉不同序列之间有效相互作用强度的度量的发现,使得能够在多组分模拟中选择最多三个无序区域序列,彼此分离,以及生成与给定序列分离的人工序列。原创 2024-01-11 10:38:40 · 1274 阅读 · 0 评论 -
AI4S - 蛋白质刚性对接(Rigid Protein-Protein Docking) 的 ElliDock 算法 简读
ElliDock 算法是用 椭圆抛物面(Elliptic-Paraboloid) 来表示蛋白质-蛋白质对接的界面,然后,通过使两个界面重合来得到对接的旋转平移变换。这种方法具有良好的旋转平移等变性,能够保证对接过程的泛化性能。实验结果表明,ElliDock 在推理时间上是所有对比方法中最快的,而且在抗体-抗原对接等任务上与当前最先进的学习方法,有着强有力的竞争力。原创 2023-12-29 17:22:20 · 548 阅读 · 0 评论 -
AI4S - 蛋白质与蛋白质的扩散对接 DiffDock-PP 算法 简读
DiffDock-PP 是一种新的刚体蛋白质-蛋白质对接方法,基于扩散生成模型,该模型学习将未结合的蛋白质结构翻译和旋转为其结合构象,基于置信模型,该模型学习对评分模型生成的不同姿势,进行排序并选择最佳姿势。原创 2023-12-27 15:46:49 · 474 阅读 · 0 评论 -
AI4S - DeepMSA2: Improving deep learning protein monomer and complex structure prediction 论文简读
DeepMSA2 是用于构建高质量的蛋白质单体和复合体多序列比对(MSA)的流程,利用了迭代的序列搜索和隐马尔可夫模型算法,从多个基因组和元基因组数据库中提取了大量的同源序列。DeepMSA2 的主要优势在于平衡的序列搜索和有效的模型选择,以及利用海量元基因组数据库的能力,这些结果表明通过改进 MSA 的构建,可以为深度学习蛋白质结构预测提供一个新的途径,也证明了优化深度学习方法的输入信息,与设计预测器本身一样重要。原创 2023-12-21 13:37:27 · 507 阅读 · 0 评论