6.ArchR的可视化(2):TF activity

本文介绍了ArchR在转录因子活性分析中的可视化方法,包括缺失的Motif序列标识图和时间消耗的讨论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

愿武艺晴小朋友一定得每天都开心 


> ## 用拿到的确定的(第N版)celltype进行拟混池重复
> library('BSgenome.Hsapiens.UCSC.hg19')
> getCellColData(projHeme2)
> projHeme2 <- addGroupCoverages(ArchRProj=projHeme2, groupBy="celltype") #构建拟混池重复
ArchR logging to : ArchRLogs/ArchR-addGroupCoverages-46462edece89-Date-2024-04-22_Time-21-20-26.log
If there is an issue, please report to github with logFile!
2024-04-22 21:21:09 : Creating Coverage Files!, 0.723 mins elapsed.
2024-04-22 21:21:09 : Batch Execution w/ safelapply!, 0.723 mins elapsed.
2024-04-22 21:25:08 : Adding Kmer Bias to Coverage Files!, 4.705 mins elapsed.
2024-04-22 21:29:29 : Finished Creation of Coverage Files!, 9.057 mins elapsed.
ArchR logging successful to : ArchRLogs/ArchR-addGroupCoverages-46462edece89-Date-2024-04-22_Time-21-20-26.log
> projHeme2 <- addReproduciblePeakSet( #添加可再现峰集
+   ArchRProj = projHeme2, 
+   groupBy="celltype",
+   maxPeaks = 200000,
+   pathToMacs2 = "/home/u37189/miniconda3/envs/Rlibrary/bin/macs2")
ArchR logging to : ArchRLogs/ArchR-addReproduciblePeakSet-46463d5f2b4a-Date-2024-04-22_Time-21-31-10.log
If there is an issue, please report to github with logFile!
2024-04-22 21:31:13 : Peak Calling Parameters!, 0.045 mins elapsed.
                  Group nCells nCellsUsed nReplicates nMin nMax maxPeaks
B cell           B cell   1898       1550           5   81  500   200000
Basophil       Basophil    560        538           4   91  185   200000
CD4M               CD4M   3578       2138           5  194  500   200000
C
### 如何在单细胞ATAC-seq数据分析中使用ArchR整合MACS2 Peak Calling结果 #### 准备工作 为了成功地将MACS2的peak calling结果整合到ArchR的工作流中,需要先准备好经过质量控制并已对齐至基因组的BAM文件。这些文件通常由FastQC、Trimmomatic以及Bowtie2等工具处理得到[^2]。 #### MACS2 Peak Calling 完成上述准备工作之后,可以采用MACS2来进行peak calling操作。这一步骤能够识别出开放染色质区域的位置信息。命令如下所示: ```bash macs2 callpeak -t sample.bam -f BAMPE -g hs -n sample_name --call-summits ``` 此过程会生成多个输出文件,其中最重要的便是`.narrowPeak`格式的结果文件,它包含了所检测到peaks的具体位置及其信号强度等重要属性。 #### 导入Peaks至ArchR 一旦获得了高质量的peak calls列表,下一步就是将其导入ArchR环境中以便进一步分析。具体做法是在创建新的`ArrowFileSet`对象之前指定自定义峰集合路径作为参数传递给函数`addArrows()`: ```r library(ArchR) # 假设已经存在一个名为'project'的对象表示当前项目实例, # 并且有一个变量'macs_peaks_path'存储着指向.narrowPeak文件夹绝对路径. arrows <- addArrows( project = project, inputFiles = macs_peaks_path, outputFileName = "customPeaks.arrow", genome = "hg38" ) ``` 通过这种方式加载外部产生的峰值数据后,就可以像平常一样继续执行后续的任务了,比如构建CellDataSets、计算可访问性矩阵等等[^1]。 #### 数据校正与降维可视化 当所有的预处理步骤完成后,还可以考虑应用一些额外的技术来改善最终呈现效果。例如,在多模态研究场景下,可能会涉及到不同平台间存在的批次效应问题;此时便可以通过诸如ProjectLSI这样的方法来进行矫正[^3]。另外,对于想要探索RNA和ATAC两种模式之间关系的研究者来说,则可能需要用到类似于SnapATAC所提供的联合嵌入功能[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值