gReLU框架:DNA序列建模与设计的深度学习工具

部署运行你感兴趣的模型镜像

gReLU:DNA序列建模与设计的综合框架

深度学习模型在DNA序列上的训练能够预测细胞类型特异性调控活性、揭示顺式调控语法、优先处理遗传变异并设计合成DNA。然而,正确构建和解释这些模型仍然很困难,不同组构建的模型和软件通常缺乏互操作性。

我们提出了gReLU,一个综合性软件框架,支持高级序列建模流程,包括数据预处理、建模、评估、解释、变体效应预测和调控元件设计。

主要特性

数据输入

gReLU接受标准格式的DNA序列或基因组坐标以及功能数据。给定基因组坐标,它可以从公共数据库加载相应的序列和注释。

数据处理

gReLU的预处理功能包括过滤序列、匹配具有相似序列内容的基因组区域、计算测序覆盖度以及拆分训练、验证和测试数据集。gReLU提供PyTorch数据集类,支持批处理、数据增强、归一化和转换。

模型设计

gReLU提供可自定义的架构,从小型卷积模型到大型Transformer模型。用户可以更改参数,如层数、过滤器的数量和宽度以及激活函数。

模型训练

gReLU训练模型以执行单任务或多任务回归、单任务或多任务二元分类、分割或多类分类。为每个任务提供合适的损失函数。类别或示例加权允许用户强调示例子集。

推理和评估

gReLU使用适当的指标在保留数据上评估模型。对于配置文件模型,gReLU返回预测结果以及相应的基因组坐标。它还支持数据增强以提高推理过程中的鲁棒性。

序列解释

gReLU可以使用计算机诱变、DeepLift/SHAP或基于梯度的方法对输入序列中每个碱基的重要性进行评分。它还可以通过使用位置权重矩阵扫描重要区域来注释它们。

模型解释

gReLU可以生成合成DNA序列,其中基序被洗牌、重新定位或插入随机背景中。在此类序列上计算预测可以揭示模型学习到的调控语法。

变体效应预测

给定表格格式的遗传变异,gReLU提取参考和替代等位基因周围的序列,并使用任何训练过的模型对它们进行推理。它通过比较两个等位基因的结果来计算每个变体的效应大小。

序列设计

gReLU支持使用定向进化或基于梯度的方法进行模型驱动的DNA设计。用户可以定义设计目标,约束要编辑的位置,并鼓励或阻止特定模式。

预测变换层

gReLU引入了预测变换层,这些灵活的层可以附加到此类模型上以修改其输出,例如计算两种细胞类型之间预测的差异。

模型库

gReLU包括一个免费提供的模型库,其中包含广泛适用的模型,包括Enformer和Borzoi。它存储模型检查点以及记录其创建的代码、数据集和日志。

应用案例

为了说明gReLU如何提名调控变异,我们训练了一个回归模型来预测GM12878细胞中的DNase I超敏感位点测序信号。使用该模型,我们预测了28,274个单核苷酸变异的影响,其中约2%是在淋巴母细胞系中鉴定的dsQTL。

利用gReLU的模型库和预测变换层,我们在相同的变异上对Enformer进行了基准测试,并获得了更高的AUPRC为0.60,这可能是由于其长输入长度、配置文件建模和多物种训练。

为了证明gReLU支持多任务、长上下文和配置文件模型的系统解释和序列设计,我们将模型库中的Borzoi模型应用于人类的PPIF基因。使用gReLU,我们可视化了预测的RNA测序覆盖度,发现它与真实数据非常接近。

使用gReLU的定向进化和预测变换功能,我们迭代地修改了增强子,旨在最大化单核细胞和T细胞之间PPIF外显子覆盖度的差异。对增强子进行20个碱基编辑后,我们实现了预测的单核细胞表达增加41.76%,而预测的T细胞表达仅增加16.75%。

结论

gReLU使科学家能够轻松训练、应用、微调和解释最先进的序列模型,并设计具有复杂特性的新型调控元件。它是开源的,包含用户贡献和建议的说明以及详细教程。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.9

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值