- 博客(25)
- 收藏
- 关注
原创 【分子材料发现】——AdsorbDiff:基于条件去噪扩散的吸附物放置研究
确定吸附质在吸附基底上的最佳配置对于探索新型催化剂的各种应用至关重要。传统上,寻找能量最低的吸附剂配置需要将吸附质放置到吸附基底上,然后进行优化。之前的方法依赖于启发式方法、针对特定问题的直觉或野蛮方法来指导吸附剂的放置。在这项工作中,我们提出了一种利用去噪扩散进行吸附质放置的新型框架。该模型旨在预测与最低能量配置相对应的最佳吸附质的位置和方向。此外,我们还提出了一个端到端的评估框架,即利用预训练的机器学习力场对扩散预测的吸附剂构型进行优化,最后利用密度泛函理论(DFT)进行评估。
2025-04-08 14:44:21
997
原创 【机器学习】【分子属性预测】——python读取.tar.gz文件(以OC22数据集为例)
以OC22数据集为例,实现python读取.tar.gz文件
2024-12-10 15:00:37
518
原创 【分子材料发现】——GAP:催化过程中吸附构型的多模态语言和图学习(数据集处理详解)(二)
催化过程中吸附构型的多模态语言和图学习数据集处理详解。
2024-12-08 20:02:21
1251
原创 【分子材料发现】——数据集详解Open Catalyst 2022(OC22)
机器学习模型在电催化剂开发中的应用需要大量的训练数据,以确保它们能够在各种材料上使用。目前,氧化物这一类材料缺乏足够的训练数据,这对于氧进化反应(Oxide Evolution Reaction, OER)催化剂的开发至关重要。为了解决这个问题,开发了Open Catalyst 2022(OC22)数据集,该数据集包含了62,331个密度泛函理论(DFT)松弛计算(约9,854,504个单点计算)涵盖了一系列氧化物材料、覆盖度和吸附物。OC22定义了广义的总能量任务,使得能够预测包含吸附能量以外的其他属性。
2024-12-06 17:29:14
2295
原创 【分子材料发现】——GAP:催化过程中吸附构型的多模态语言和图学习(论文简述)(一)
吸附能是催化筛选中必须准确预测的反应性描述符,对于有效的机器学习(ML)应用至关重要。这个过程涉及在催化表面上找到不同吸附构型中的最低能量,这些构型通常具有非常相似的能量。虽然图神经网络(GNNs)在计算催化剂系统的能量方面取得了巨大成功,但它们严重依赖于原子空间坐标。相比之下,基于transformer的语言模型可以直接使用人类可读的文本输入,潜在地绕过了对详细原子位置或拓扑结构的需求。然而,这些语言模型在准确预测吸附构型的能量方面常常遇到困难。
2024-11-27 15:19:35
1534
原创 【分子材料发现】——EGNN:E(n) Equivariant Graph Neural Networks(论文简述)
这篇论文介绍了一种新的模型,用于学习对旋转、平移、反射和排列具有等变性的图神经网络,称为E(n)-等变图神经网络(EGNN)。与现有方法相比,我们的工作不需要在中间层使用计算成本高昂的高阶表示,同时仍然能够达到竞争性或更好的性能。此外,与现有方法仅限于三维空间的等变性不同,我们的模型可以轻松扩展到更高维度的空间。我们通过动态系统建模、图自编码器中的表示学习以及预测分子属性来展示我们方法的有效性。
2024-11-19 22:43:57
1531
原创 【分子材料发现】——GILL:使用多模态语言模型生成图像(论文简述)
论文提出了一种方法,通过映射。论文提出的模型展示了一系列多模态能力:图像检索、新颖图像生成和多模态对话。本方法首次能够根据任意交错的图像和文本输入来生成连贯的图像(和文本)输出。为了在图像生成上实现强大的性能,论文提出了一个高效的映射网络,将LLM与现成的文本到图像生成模型联系起来。这个==映射网络将文本的隐藏表示转换为视觉模型的嵌入空间,使我们能够利用LLM的强大文本表示来输出视觉内容。==论文提出的方法在处理更长、更复杂的语言任务上超越了基线生成模型。
2024-11-13 23:42:20
1026
原创 【分子材料发现】——MolCA: 使用跨模态投影器和单模适配器的分子图-语言建模(论文简述)
语言模型(LMs)在各种一维文本相关任务中展示了令人印象深刻的分子理解能力。然而,它们固有地——这是人类专业人员理解分子拓扑结构的关键能力。为了弥合这一差距,我们提出了MolCA:使用跨模态投影器和单模适配器的分子图-语言建模。==MolCA通过跨模态投影器使LM(例如Galactica)能够理解基于文本和图形的分子内容。具体而言,跨模态投影器被实现为Q-Former,以连接图形编码器的表示空间和LM的文本空间。==此外,MolCA使用单模适配器(即LoRA)使LM有效地适应下游任务。
2024-11-12 21:18:25
1246
原创 【分子材料发现】——晶体表示方法SLICES
源自论文《An invertible, invariant crystal representation for inverse design of solid-state materials using generative deep learning》。类似于分子设计的SMILES表示,SLICES将晶体结构的拓扑和组成编码为字符串,是一种基于字符串的编码框架,能够满足晶体设计可逆性和不变性的要求。具体的使用方法等相关内容将在后续博主进行实验时更新(to be continued…
2024-11-04 20:37:48
303
原创 【分子材料发现】——MolCA: 使用跨模态投影器和单模适配器的分子图-语言建模(论文翻译)
语言模型(LMs)在各种一维文本相关任务中展示了令人印象深刻的分子理解能力。然而,它们固有地缺乏二维图形感知——这是人类专业人员理解分子拓扑结构的关键能力。为了弥合这一差距,我们提出了MolCA:使用跨模态投影器和单模适配器的分子图-语言建模。MolCA通过跨模态投影器使LM(例如Galactica)能够理解基于文本和图形的分子内容。具体而言,跨模态投影器被实现为Q-Former,以连接图形编码器的表示空间和LM的文本空间。此外,MolCA使用单模适配器(即LoRA)使LM有效地适应下游任务。
2024-10-26 20:08:37
1363
原创 【分子材料发现】——ReactXT:通过反应情境化分子-文本预训练理解分子“反应关系”(论文翻译)
反应-情境化分子-文本预训练(ReactXT)是一种新兴的研究方向,旨在通过文本界面和文本知识来促进与分子相关的任务。与单个分子研究不同,反应-文本建模有助于新材料和药物的合成。然而,以往的研究大多忽视了反应-文本建模,主要集中在建模单个分子-文本对或学习没有上下文的化学反应上。此外,反应-文本建模的一个关键任务——实验过程预测,由于缺乏开源数据集而较少被探索。该任务旨在预测进行化学实验的逐步操作,对于自动化化学合成至关重要。
2024-10-21 15:20:52
1166
原创 【分子材料发现】——AdsorbML:利用可推广的机器学习潜力,实现吸附能计算效率的飞跃(论文翻译)
计算催化在各种应用的催化剂设计中发挥着越来越重要的作用。许多计算方法的一个常见任务是需要准确计算感兴趣的吸附物和催化剂表面的吸附能。传统上,低能吸附质-表面构型的识别依赖于启发式方法和研究人员的直觉。随着进行高通量筛选的愿望增加,单独使用heuristics(启发式)和intuition(直觉)变得具有挑战性。在本文中,我们证明了可以利用机器学习潜力来更准确、更有效地识别低能吸附物表面构型。我们的算法提供了准确性和效率之间的一系列权衡,其中一个平衡选项在87.36%的情况下都能找到最低能量配置,同时实现约
2024-10-15 09:50:26
1461
原创 【分子材料发现】——材料发现中的First principle(第一性原理)
mo 、e、h、c、kB以及元素周期表中各组分元素的电子结构,就可以合理地预测材料的许多物理性质。因此,第一性原理计算可以称得上真正意义的预测。它无需经验参数却可以达到很高的精度:用第一性原理计算的晶胞大小和实验值只差几个百分点,其它性质也和实验很好地吻合,体现了该理论的正确性。第一性原理计算是指从所研究材料的原子组分开始,计算过程中运用到了量子力学及多种基本物理规律,通过自洽计算来确定材料的几何结构、电子结构、力热学性质和光学性质等材料物性的方法。
2024-10-09 18:32:25
998
原创 【自然语言处理】之——实体关系抽取数据集
Duie2.0数据集是一个面向实体关系抽取任务的开放式中文数据集。它是由中国科学院计算技术研究所推出的,用于促进自然语言处理和知识图谱的研究和应用。该数据集包含了来自新闻、百度百科、微博等多个领域的文本数据。每个样本都由一个实体、关系和上下文组成,旨在让机器理解实体之间的关系。
2023-09-19 10:14:02
3367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1