数据原理——2、ChIA-PET

本文详细介绍了ChIA-PET技术,包括背景、测序原理、步骤和数据处理。ChIA-PET利用双交联固定DNA-蛋白质复合物,通过超声破碎和目标蛋白抗体富集,进行染色质相互作用分析。数据处理涉及连接子过滤、PET映射、冗余去除等7个步骤。此外,文章还提到了ChIA-PET Tool、Mango、MICC和ChIA-PET2等数据分析方法,并比较了它们的性能。


一、背景介绍

利用成对末端标记序列(ChIA-PET)进行染色质相互作用分析是一种将功能染色质结构转化为数百万个短标记序列的方法

配对末端标签测序ChIA-PET技术应用了PET测序技术的基本原理。PET测序技术的独特之处在于构建配对末端测序模板。从目的DNA片段两个末端提取短标签并将它们配对构成一个PET,对PET进行高通量测序,利用标签序列定位目的DNA片段在基因组中的位置。为了获得短标签,将目的DNA片段两个末端分别与设计好的半连接子(linker)相连。半连接子为具有MmeI限制性内切酶识别位点的寡聚核苷酸序列,而MmeI限制性内切酶能够水解其识别位点下游18/20个碱基对。连接子连接后将DNA片段两个末端配对,随后加入MmeI限制性内切酶,便可得到“标签-连接子-标签(tag-linker-tag)”结构。

在这里插入图片描述

二、测序原理

1, 用甲醛铰链DNA和蛋白,目的是让可能存在相互影响的DNA片段连接;
2, 用超声等方法将DNA片段化;
3, 用特异性蛋白抗体富集DNA和蛋白复合物;
4, 在DNA片段末端加上包含MmeI位点的生物素化寡核苷酸linker;
5, 连接linker,从而形成连接目的DNA片段的桥梁;
6, 用限制性内切酶消化得到DNA片段,去除蛋白质;
7, 固定化PET序列;
8,上机测序。

三、测序

1、先乙二醇、再用甲醛进行双交联,固定DNA-蛋白质复合物。细胞溶解去除胞质蛋白
2、使用超声波破碎染色质通常应该打断为200bp到600bp的DNA片段,其平均长度为500bp

short-read ChIA-PET: read长度为36bp,测序的DNA片段长度为20bp左右
long-read ChIA-PET: 平均长度为300bp(Tangetal.,2015)

3、加入目标蛋白抗体,富集含有目标蛋白的DNA-蛋白质复合物。

为了区分来自不同蛋白交联区域的序列,ChIA-PET引入了双末端标签(Paired-End Tags)标记。双末端标签的目的在于,区分连接之后的DNA序列是否来自同一个蛋白结合的序列。
在这里插入图片描述

4-8.1 short-read ChIA-PET:

A、B两种linker的序列中包含一个指定位置上的短标签(由红色标注)
在这里插入图片描述

  1. 两种half-linkerA和B分别加到两等份样品中用于linker连接。
  2. 将这两等份混合时,两个half-linker连接在一起构成了全长的linker序列。
  3. half-linker与ChIP-DNA结合的一端中包含MmeⅠ酶的一段识别序列,以实现第三步片段化
  4. 使用MmeⅠ向ChIP-DNA方向切割20bp,以此得到tag-linker-tag格式的PETs(Paired-EndTags), Tag指的是使用MmeⅠ酶切下来的ChIP-DNA片段
  5. 每对tags经过PCR扩增
  6. 测序分析

交联-染色质碎裂-染色质沉淀-两份单独的等分试样中的接头连接-邻近结扎-限制性内切-PET测序

  1. 如果测序得到的结果中,两段序列的linker都带有相同的短标签,则说明他们来自同一个蛋白结合的序列,存在互相作用,是我们想要得到的序列;
  2. 相反,如果两段序列的linker带有不同的短标签(chimeric PET),则说明他们来自于不同的蛋白交联,应该从我们的数据分析中被排除。
4-8.2 long-read ChIA-PET:
  1. 加入一条生物素标记的bridge linker序列进行邻近连接
  2. 使用Tn5转座酶将连接产物片段化,同时加上测序接头
  3. PCR扩增
  4. 测序

交联和超声-生物素标记-邻近结扎-Tn5转座酶将连接产物片段化,同时加上测序接头- PCR 扩增-测序

在这里插入图片描述

primer(引物):引物是人工合成的两段寡核苷酸序列,一个引物与目的基因一端的一条DNA模板链互补,另一个引物与目的基因另一端的另一条DNA模板链互补

  1. 长度:18-27bp
  2. 功能:PCR扩增,影响PCR特异性

四、数据处理

对端测序的结果存储在2个fastq文件中,可以使用ChIA-PET工具(ChIA-PET2)或其他方法进行处理。

ChIA-PET数据处理有7个步骤

1、连接子过滤

  • 连接体将与参考半连接体核苷酸序列对齐。除标签序列外,有2种半连接体,分别为A和B,有相同的核苷酸。据连接体的组成将PET分为2类:相同的连接体(AA或BB)和不同的连接体(AB或BA),然后将连接体从原始测序片段中排除,并保留剩余的DNA片段以供进一步分析

2、PET映射

  • 用BWA、Bowtie、Batmis或其他绘图工具将短DNA序列与参考基因组对齐

3、冗余去除

  • 使用samtools和bedtools过滤掉冗余和低质量的映射序列

4、自连和互连PET分类

  • 自连PET:从两端循环的单个DNA片段的测序片段,并在同一染色体上的短距离内映射到基因组。
  • 互连PET:来自不同DNA片段的测序片段,通常2个标签位于不同染色体中或长距离位于同一染色体中。

5、结合位点分析自连Pet

  • 用自连PET来确定基因组上的蛋白质结合位点

6、用互连Pet进行染色质相互作用分析

  • 互连PET可以通过聚类来预测染色质相互作用

7、染色质相互作用数据的可视化

  • 构建ChIA-PET浏览器来报告数据并可视化结合位点以及交互集群
    在这里插入图片描述

五、ChIA-PET数据分析方法

1、ChIA-PET Tool介绍

能够产生准确的交互,但是软件只执行ChIA-PET数据分析、交互评分中的最后一步。软件包不公开。

2、Mango介绍

Mango将基因组位点间相互作用的可能性作为距离和峰深的函数进行建模,并使用该模型为相互作用分配统计置信度。值得注意的是,Mango用一种简单而健壮的贝叶斯方法取代了计算上昂贵的距离匹配重布线方法。
由于使用方便和准确性的提高,Mango将通过对ChIA-PET数据集的分析,大幅提升揭示三维染色质结构特征和功能的能力。同时也纠正了非特定的相互作用,可以作为一个基因组接近和峰深的函数。
Mango被设计成所有的研究人员都可以使用,易安装,只需一个命令就可以完成从fastq到交互的所有步骤。

3、 MICC介绍

MICC,一种易于使用的R包,用于处理ChIA-PET数据。MICC旨在以高灵敏度检测染色质相互作用,同时将错误发现率(FDR)控制在合理水平。 MICC的输入是源自ChIA-PET数据的原始PET簇。 MICC的最终输出包括:将PET簇描述为真实相互作用簇的后验概率列表和相应的FDR。在不同数据集的相同FDR上,MICC总能检测到比ChIA-PET工具和ChiaSig更多的相互作用。此外,MICC检测到的相互作用在生物学重复之间也更加一致。

3、ChIA-PET2介绍

ChIA-PET2能够分析不同类型的ChIA-PET数据从原始的测序读段,形成染色质互作环(chromatin loops)的有效便捷的工具。尽管目前已有很多用于分析ChIA-PET数据的工具,例如,ChIA-PET Tool,ChiaSig,MICC,Mango和3CPET,但ChIA-PET2有其自身的优势
在这里插入图片描述
ChIA-PET2整合了ChIA-PET数据分析的所有步骤,包括linker trimming,read alignment,duplicate removal,peak calling和chromatin loop calling。

4、各种工具之间的性能比较
  1. Mango仅依赖4个广泛使用且易于安装的软件包。
  2. MICC,从ChIA-PET的数据中检测显著染色质相互作用。
  3. 与ChIA-PET Tool相比,MICC使用较低深度的测序库恢复了较高深度测序库中检测到的交互作用的显著比例。还为PET集群提供了更一致的排序,从而可以提高实验复制之间的再现性。
  4. ChIA-PET2支持不同类型的ChIA-PET技术产生的ChIA-PET数据,并针对不同CHIA-PET分析步骤提供质量控制。将ChIA-PET2应用于不同的ChIA-PET数据集,在处理原始的ChIA-PET数据时,ChIA-PET2都有良好的性能、稳定性以及易操作性

参考:

https://www.bilibili.com/video/av970780224?p=61

https://v.youku.com/v_show/id_XNjg5MTM2MTc2.html

https://www.sogou.com.

https://mp.weixin.qq.com/s

https://zhuanlan.zhihu.com/p/50531264

源码来自:https://pan.quark.cn/s/a3a3fbe70177 AppBrowser(Application属性查看器,不需要越狱! ! ! ) 不需要越狱,调用私有方法 --- 获取完整的已安装应用列表、打开和删除应用操作、应用运行时相关信息的查看。 支持iOS10.X 注意 目前AppBrowser不支持iOS11应用查看, 由于iOS11目前还处在Beta版, 系统API还没有稳定下来。 等到Private Header更新了iOS11版本,我也会进行更新。 功能 [x] 已安装的应用列表 [x] 应用的详情界面 (打开应用,删除应用,应用的相关信息展示) [x] 应用运行时信息展示(LSApplicationProxy) [ ] 定制喜欢的字段,展示在应用详情界面 介绍 所有已安装应用列表(应用icon+应用名) 为了提供思路,这里只用伪代码,具体的私有代码调用请查看: 获取应用实例: 获取应用名和应用的icon: 应用列表界面展示: 应用列表 应用运行时详情 打开应用: 卸载应用: 获取info.plist文件: 应用运行时详情界面展示: 应用运行时详情 右上角,从左往右第一个按钮用来打开应用;第二个按钮用来卸载这个应用 INFO按钮用来解析并显示出对应的LSApplicationProxy类 树形展示LSApplicationProxy类 通过算法,将LSApplicationProxy类,转换成了字典。 转换规则是:属性名为key,属性值为value,如果value是一个可解析的类(除了NSString,NSNumber...等等)或者是个数组或字典,则继续递归解析。 并且会找到superClass的属性并解析,superClass如...
基于遗传算法辅助异构改进的动态多群粒子群优化算法(GA-HIDMSPSO)的LSTM分类预测研究(Matlab代码实现)内容概要:本文研究了一种基于遗传算法辅助异构改进的动态多群粒子群优化算法(GA-HIDMSPSO),并将其应用于LSTM神经网络的分类预测中,通过Matlab代码实现。该方法结合遗传算法的全局搜索能力与改进的多群粒子群算法的局部优化特性,提升LSTM模型在分类任务中的性能表现,尤其适用于复杂非线性系统的预测问题。文中详细阐述了算法的设计思路、优化机制及在LSTM参数优化中的具体应用,并提供了可复现的Matlab代码,属于SCI级别研究成果的复现与拓展。; 适合人群:具备一定机器学习和优化算法基础,熟悉Matlab编程,从事智能算法、时间序列预测或分类模型研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①提升LSTM在分类任务中的准确性与收敛速度;②研究混合智能优化算法(如GA与PSO结合)在神经网络超参数优化中的应用;③实现高精度分类预测模型,适用于电力系统故障诊断、电池健康状态识别等领域; 阅读建议:建议读者结合Matlab代码逐步调试运行,理解GA-HIDMSPSO算法的实现细节,重点关注种群划分、异构策略设计及与LSTM的集成方式,同时可扩展至其他深度学习模型的参数优化任务中进行对比实验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值