OpenBioMed 开源项目使用教程

OpenBioMed 开源项目使用教程

OpenBioMed OpenBioMed 项目地址: https://gitcode.com/gh_mirrors/ope/OpenBioMed

1. 项目介绍

OpenBioMed 是一个用于 AI 赋能生物医学的 Python 深度学习工具包。它提供了对多模态生物医学数据的便捷访问,包括分子结构、转录组学、知识图谱和生物医学文本数据。OpenBioMed 支持广泛的下游应用,从传统的 AI 药物发现任务到新兴的多模态挑战。

OpenBioMed 的主要特点包括:

  • 统一数据处理管道:轻松加载和转换来自不同生物医学实体和模态的异构数据为统一格式。
  • 现成的推理:公开可用的预训练模型和推理演示,可轻松转移到您自己的数据或任务。
  • 可复现的模型库:灵活地在现有和新应用上复制和扩展最先进的模型。

2. 项目快速启动

环境搭建

首先,创建并激活一个 conda 环境:

conda create -n OpenBioMed python=3.9
conda activate OpenBioMed

安装所需的包:

pip install -r requirements.txt

安装 PyG 依赖项:

pip install pyg_lib torch_scatter torch_sparse torch_cluster torch_spline_conv -f https://data.pyg.org/whl/torch-$(TORCH_VERSION)+$(CUDA_VERSION).html
pip install torch-geometric

快速启动示例

以下是一个使用 OpenBioMed 进行分子性质预测的快速启动示例:

from openbiomed import MoleculePropertyPrediction

# 加载数据集
dataset = MoleculePropertyPrediction.load_dataset('MoleculeNet')

# 训练模型
model = MoleculePropertyPrediction.train(dataset)

# 测试模型
results = MoleculePropertyPrediction.test(model, dataset)
print(results)

3. 应用案例和最佳实践

案例1:分子描述生成

使用 MolFM 模型生成分子的描述文本:

from openbiomed import MoleculeCaptioning

# 加载数据集
dataset = MoleculeCaptioning.load_dataset('ChEBI-20')

# 使用 MolFM 生成描述
descriptions = MoleculeCaptioning.generate_captions(dataset, model='MolFM')
print(descriptions)

案例2:细胞类型分类

使用 CellLM 模型对细胞类型进行分类:

from openbiomed import CellTypeClassification

# 加载数据集
dataset = CellTypeClassification.load_dataset('Zheng68k')

# 训练 CellLM 模型
model = CellTypeClassification.train(dataset)

# 测试模型
results = CellTypeClassification.test(model, dataset)
print(results)

4. 典型生态项目

BioMedGPT

BioMedGPT 是一个商业友好的多模态生物医学基础模型,由 PharMolix 和 AI 产业研究院联合发布。它将生命语言(分子结构和蛋白质序列)与人类自然语言对齐,在生物医学 QA 基准上表现与人类专家相当,并在跨模态分子和蛋白质问答任务中展示了强大的性能。

MolFM

MolFM 是一个多模态分子基础模型,支持对分子结构、生物医学文本和知识图谱的联合理解。在跨模态检索任务中,MolFM 在零样本和微调场景下分别比现有模型提升了 12.03% 和 5.04%。

CellLM

CellLM 是首个使用分支对比学习策略在正常细胞和癌症细胞数据上同时训练的大规模细胞表示学习模型。它在细胞类型注释、少样本场景下的单细胞药物敏感性预测和单组学细胞系药物敏感性预测上均优于 ScBERT。

OpenBioMed OpenBioMed 项目地址: https://gitcode.com/gh_mirrors/ope/OpenBioMed

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

### 使用PINN(物理信息神经网络)解决偏微分方程的实例 #### 背景介绍 物理信息神经网络(Physics-Informed Neural Networks, PINNs)是一种结合深度学习与物理学知识的方法,能够高效求解复杂的偏微分方程(Partial Differential Equations, PDEs)。这种方法的核心在于将已知的物理规律作为约束条件嵌入到神经网络训练过程中,从而提高模型预测能力并减少对大量数据的需求。 以下是几个典型的PINN用于求解PDE的具体案例及其代码实现: --- #### 案例1:一维热传导方程 在一维空间中,热传导过程可以用如下形式表示: \[ u_t = \alpha u_{xx}, \quad x \in [a,b], t > 0, \] 其中 \(u(x,t)\) 表示温度分布,\(t\) 是时间变量,\(x\) 是位置坐标,而 \(\alpha\) 则代表材料的导热系数。边界条件可以设定为固定端点处的温度值或者绝热状态下的梯度零假设。 ##### 实现步骤 下面展示了一段基于PyTorch框架的一维热传导方程解决方案[^2]: ```python import torch import numpy as np # 定义神经网络结构 class Net(torch.nn.Module): def __init__(self, layers): super(Net, self).__init__() self.linears = torch.nn.ModuleList([torch.nn.Linear(layers[i], layers[i+1]) for i in range(len(layers)-1)]) def forward(self, x): a = x for i, l in enumerate(self.linears[:-1]): a = torch.tanh(l(a)) a = self.linears[-1](a) return a # 初始化参数 layers = [2, 20, 20, 1] # 输入维度 (x,t),隐藏层节点数,输出维度(u) model = Net(layers) def compute_loss(model, x_data, t_data, alpha=0.1): """定义损失函数""" xt = torch.cat((x_data.unsqueeze(-1), t_data.unsqueeze(-1)), dim=-1).requires_grad_(True) u_pred = model(xt) grad_u = torch.autograd.grad( outputs=u_pred.sum(), inputs=xt, create_graph=True)[0] u_x = grad_u[:, 0].view(-1, 1) u_t = grad_u[:, 1].view(-1, 1) hessian_xx = torch.autograd.grad(outputs=u_x, inputs=xt, retain_graph=True, create_graph=True)[0][:, 0].view(-1, 1) pde_residual = u_t - alpha * hessian_xx mse_pde = torch.mean(pde_residual ** 2) return mse_pde # 训练循环省略... ``` 上述代码片段展示了如何构建一个简单的全连接前馈神经网络,并通过自动微分技术计算目标函数相对于输入的空间二阶导数以及时间一阶导数,进而形成残差项以优化整个系统性能。 --- #### 案例2:Burgers' 方程 另一个经典例子是非线性的 Burgers’ 方程,在流体力学领域具有重要意义: \[ u_t + uu_x = \nu u_{xx}, \] 这里引入了粘滞效应因子 \(\nu>0\) 来描述扩散现象的影响程度。该类问题同样可以通过调整相应超参设置来适配不同场景需求[^1]。 --- #### 已验证的有效性分析 研究表明,相比于传统数值方法如有限元法或谱方法等,采用PINN不仅可以获得更高的精度而且还能显著降低运算成本特别是当面对高维情形时优势更加明显。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

薄正胡Plains

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值