- 博客(14)
- 收藏
- 关注
原创 NanoCon:基于对比学习的深度混合网络用于纳米孔甲基化检测
摘要动机:5-甲基胞嘧啶 (5mC) 是真核生物 DNA 甲基化的基本元素,在基因表达调控、胚胎发育和其他生物过程中起着至关重要的作用。尽管已经提出了几种计算方法来从纳米孔测序数据中检测 DNA 中的碱基修饰,例如 5mC 位点,但它们面临着包括对噪声的敏感性以及忽略现实场景中甲基化位点分布不平衡等挑战。结果:在这里,我们开发了 NanoCon,这是一种深度混合网络,结合对比学习策略,用于从纳米孔读数中检测 5mC 甲基化位点。特别是,我们采用了对比学习模块来缓解纳米孔测序中数据分布不平衡造成的问题
2024-10-08 20:35:50
1085
原创 ABSP:一种自动化 R 工具,可有效分析亚硫酸盐测序 PCR 中的区域特异性 CpG 甲基化
摘要动机:如今,从胚胎发育到癌症和神经退行性疾病等疾病,表观遗传基因调控在生物学的各个部分都有研究。目前,为了量化和比较特定感兴趣区域的 CpG 甲基化水平,最容易获得的技术是亚硫酸盐测序 PCR (BSP)。然而,没有现有的用户友好型工具能够分析所有 BSP 方法的数据。因此,处理 PCR 产物直接测序 (direct-BSP) 结果的最方便方法是手动分析色谱图轨迹,这是一项重复且容易出错的任务。结果:在这里,我们实现了一个基于 R 的新工具,称为 ABSP,用于分析亚硫酸盐测序 PCR,提供直接
2024-09-26 21:23:05
748
原创 DNA 甲基化特征表明,不同的转录因子组合决定了人类免疫细胞的表观遗传身份
表观遗传重编程是免疫细胞谱系指定的基础,但唯一定义免疫细胞类型的模式及其建立机制仍不清楚。在这里,我们从人类外周血中确定了六种免疫细胞类型的谱系特异性 DNA 甲基化特征,并确定了它们与其他表观遗传和转录组模式的关系。谱系特异性低甲基化的位点与每种细胞类型中不同的转录因子组合有关。相比之下,谱系特异性高甲基化的位点主要局限于适应性免疫细胞。PU.1 结合位点与不同细胞类型中的谱系特异性低甲基化和高甲基化有关,表明它以依赖于环境的方式调节 DNA 甲基化。这些观察结果表明,先天性和适应性免疫谱
2024-09-13 21:04:00
737
原创 Snapper:基于 Oxford Nanopore 读取的高灵敏度甲基化模体检测(模体甲基化程度)
一般来说,这些工具可以准确检测所考虑基因组中的甲基化位置(Stoiber 等人 2016 年)或预测所选位点的甲基化类型(6mA、5mC 和 4mC)(Tourancheau 等人 2021 年),但我们发现精确识别甲基化基序序列的过程要么不够灵敏,要么需要大量的手动控制。统计数据与参考基因组进行比较,迭代搜索 seq_set 中过度表达的基序,将其提取为潜在的修饰基序,遵循基序调整程序,这还可以确保提取的基序的正确性和完整性,并通过删除包含提取的基序变体的所有序列来过滤 seq_set 列表。
2024-09-08 15:20:47
1021
1
原创 im5C-DSCGA:基于改进的 DenseNet 和注意力机制的混合框架,用于识别人类 RNA 中的 5-甲基胞嘧啶位点
背景:5-甲基胞嘧啶(m5C)是一种关键的转录后修饰,在RNA代谢中起着至关重要的作用。由于生物体中已鉴定的m5C修饰位点大量增加,它们的表观遗传作用变得越来越不为人所知。因此,准确识别m5C修饰位点对于深入了解细胞过程和其他与生物功能相关的机制至关重要。虽然研究人员已经提出了一些传统的计算方法和机器学习算法,但仍然存在一些局限性。在本研究中,我们提出了一种更强大、更可靠的深度学习模型im5C-DSCGA,用于识别人类中新的RNA m5C修饰位点。
2024-06-26 11:18:49
921
原创 使用深度融合的改进残差网络识别 RNA 5-甲基胞嘧啶位点
动机:5-甲基胞嘧啶(m5C)是一种重要的转录后修饰。随着技术的发展,它广泛存在于各种RNA中。大量研究表明,m5C在生物体的多种活动中起着至关重要的作用,例如tRNA识别,RNA结构的稳定,RNA代谢等。传统的鉴定方法通过湿生物实验,成本高且耗时。因此,通常使用计算模型来识别m5C位点。由于深度学习的巨大计算优势,通过深度学习算法构建预测模型是可行的。结果:在本研究中,我们基于改进的残差网络的深度融合方法构建了一个识别m5C的模型。首先,
2024-06-04 15:12:27
1025
1
原创 Pssp-mvirt: 基于多视图深度学习架构的肽二级结构预测
摘要肽二级结构的预测对揭示肽的作用机制具有重要意义,具有潜在的应用前景。本文提出了一种基于多视点信息、限制和迁移学习的多视点深度学习方法——肽二级结构预测法。为了充分利用鉴别信息,提出了一种多视点融合策略,分别从序列信息、进化信息和隐藏状态信息等多个视点整合不同的信息,生成统一的特征空间。此外,我们构建了一个混合网络结构的卷积神经网络和双向门控循环单元提取全局和局部特征的多肽。此外,我们利用迁移学习有效地缓解了训练样本(具有实验验证结构的多肽)的缺乏。独立测试的比较结果表明,我们提出的方法明显优于最先进
2022-04-05 20:55:00
3251
5
原创 基于双向 lstm 和残差神经网络的 rna 二级结构预测方法
摘要背景: 研究表明,rna 二级结构是由配对碱基构成的平面结构,在基本生命活动和复杂疾病中发挥着多种重要作用。Rna 二级结构图谱可以记录每个碱基是否与其他碱基配对。因此,准确预测二级结构有助于推断 rna 的二级结构和结合位点。通过生物实验和计算方法可以得到 rna 的二级结构图谱。其中,生物实验方法包括化学试剂法和生物结晶法。化学试剂法可以获得大量的预测数据,但成本高,且噪声大,由于测序覆盖范围有限,很难得到全部基因组 rna 的预测结果。相比之下,生物结晶法测定结果准确,但实验工作量大,成本高。
2022-02-27 16:57:49
2831
1
原创 I4mc-deep: 利用具有化学特性的深度学习方法,对 n4- 甲基胞嘧啶位点进行智能预测
Dna 受到 n4- 甲基胞嘧啶(4mc)分子的表观遗传修饰。N4- 甲基胞嘧啶在 dna 修复和复制中起重要作用,保护宿主 dna 免受降解,调节 dna 表达。然而,尽管目前的实验技术可以识别4mc 位点,但这种技术是昂贵和费力的。因目录1.介绍2. 材料和方法2.1. 基准数据集2.2. 深度学习法2.3. 评估措施3. 结果和讨论3.1. 与其他最先进的工具相比较3.2.。对建议工具的解释4. 网络服务器5. 结论此,能够预测4mc 位点的计算工具对于
2022-02-08 22:45:17
1234
原创 Staem5:一种精确预测m5C位点的新计算方法
5-甲基胞嘧啶(m5c)是一种重要的转录后修饰,广泛存在于多种 rna 中。许多研究表明,m5c 在许多生物学功能中起着重要作用,如 rna 结构的稳定性和代谢。计算方法作为一种从高通量 rna 序列数据中识别 m5c 位点的有效方法,有助于解释这一重要修饰的功能机制。这项研究提出了一种新的特定物种的计算方法,staem5,来准确地预测小家鼠和拟南芥中的 rna m5c 位点。staem5采用特征融合策略来利用信息序列剖面,并结合5种常用的机器学习算法,建立了一个叠加集成学习框架。广泛的基准测试表明 sta
2022-01-11 15:03:32
2758
原创 DeepLncLoc:一种基于子序列嵌入的长非编码RNA亚细胞定位预测的深度学习框架
摘要动机:长非编码RNA(lncRNAs)是一类含有200多个核苷酸的RNA分子。越来越多的证据表明,lncRNAs的亚细胞定位可以为其生物学功能提供有价值的见解。现有预测lncRNA亚细胞定位的计算方法使用k-mer特征编码lncRNA序列。但是,仅使用k-mer特征会丢失序列顺序信息。结果:我们提出了一个深度学习框架DeepLncLoc,用于预测lncRNA亚细胞定位。在DeepLncLoc中,我们引入了一种新的子序列嵌入方法,该方法保留了lncRNA序列的顺序信息。子序列嵌入方法首先将一个
2021-12-19 16:55:37
3076
原创 基于深度学习的DNA:RNA三联体形成潜能预测
Deep learning based DNA:RNA triplexforming potential prediction1.摘要长非编码RNA(lncRNAs)可以通过与DNA形成三联体发挥作用。目前预测三倍体形成的方法主要是根据基本配对规则进行数理统计。然而,这些方法有两个主要局限性:(1)它们识别了大量形成三倍体的lncRNAs,但经实验验证的形成三倍体的lncRNAs数量有限,这表明在实践中可能并非所有的lncRNAs都能形成三倍体;(2)他们的预测只考虑了理论关系,而缺乏实验验证数据.
2021-10-05 16:40:40
2214
原创 论文解读:预测lncRNA的相互作用生物分子类型:一种集成深度学习方法
Predicting the interaction biomolecule types forlncRNA: an ensemble deep learning approach目录1.摘要2.引言3.材料和方法 1.数据描述 2.特征提取 3.模型构建 4.评估标准4.结果 1.LncRNA-生物分子相互作用的统计与分析 2.lncIBTP的初步培训以及评价3.与特定lncRNA分子预测方法的比较 4.个案研究和跨物种验证5.讨论...
2021-09-01 17:01:23
3693
原创 论文解读:基于共享混合深度学习架构的DNA形状特征预测转录因子结合位点
Predicting transcription factor binding sites using DNA shape features based on shared hybrid deep learning architecture数据:https://github.com/wangguoguoa/CRPTS表S1: Tables S1 表S2:S2表S3:Table S3目录1 文章概述2 引言3 数据4 方法 1 共享混合深度学习 2 模...
2021-08-19 19:54:51
2078
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人