- 博客(15)
- 收藏
- 关注
原创 MACS2 -m/--mfold使用
macs2 callpeak -m 5 50 -q 0.05 -t Dy_7_1_clean.bam.sort -f BAM -g mm --outdir /Data/wu_lab/yuanye/projects/CUT_TAG/zwh/peak/ -n Dy_7_1_H3K9me3 -Bhttp://www.360doc.com/content/18/0205/00/19913717_727772514.shtml
2022-08-08 21:56:28
1209
原创 Rolling_average_plots
教程:bedtools的使用技巧(持续更新)bedtools使用指南bedtools统计窗口内平均覆盖深度目的:画一个类似这样的图思路:1.划分参考基因组,将参考基因组划分为大小一样的n个窗口。比如划分hg19,每个窗口大小10kb。将这些窗口作为后续计算reads数的区间。2.利用bedtools coverage 计算每个区间的reads数,并根据RRPM进行normalization。3.利用metaplot/python的时间序列分析(pandas函数)进行作图。1.划分b
2022-05-11 11:24:45
371
原创 ATAC数据做heatmap信号热图与谱图(deeptools)
简介:本次使用的是孔老师的数据,目的想用ATAC数据中combine相对于control来说down的peak来做一组信号热图与谱图。因此bed文件使用的是提取的down的peak.bed文件。参考以下教程https://www.jianshu.com/p/1f38674b2475deeptools 提供了computeMatrix命令以计算特定基因组区域的ChIP-seq信号,并通过plotHeatmap和plotProfile函数分别产生ChIP-seq信号热图与谱图。computeMatr
2022-05-11 11:22:27
5438
2
原创 生信小tips
说明:做生信过程中有很多小细节需要注意,留个备忘录方便后面查找命令对染色体命名列内容修改第一列为染色体号,如果要修改成chr格式 sed -i -e 's/^/chr/g' ().narrowPeak
2021-12-30 09:55:50
2939
6
原创 火山图 volcano
一、数据集准备主要用到的就是log2foldchange和pvalue/padj值二、画图library(ggplot2)k_DIPG17_2_1_merge_2vs1_25 <- read.csv("DIPG17_2_1_merge_2vs1_25.csv")DIPG17_2_1_merge_2vs1_25_up<-subset(k_DIPG17_2_1_merge_2vs1_25,pvalue<0.05 & log2FoldChange >1)DIPG17_
2021-12-16 17:30:42
811
原创 sratoolkit 2.11.3安装与使用
备注:下载该版本原因是因为使用2.9.2版本的fastq-dump/fasterq-dump出现了以下错误fasterq-dump --split-3 SRRid -e 72021-12-02T12:47:28 fasterq-dump.2.9.2 sys: timeout exhausted while reading file within network system module - mbedtls_ssl_read returned -76 ( NET - Reading informatio
2021-12-02 21:48:56
2387
原创 从头RNASEQ
1.QC质控 步骤与CHIPSEQ相同2.STAR进行比对2.1建立STAR索引建立索引前首先下载参考基因组文件人类参考基因组网站https://www.gencodegenes.org/human/↑下载GTF文件以及fa文件。利用wget -c可以无断点下载。鼠的基因组同上。建立索引时 STAR --runMode genomeGenerate --runThreadN 16 --genomeDir /Data/wu_lab/reference/starindex/mouse
2021-10-27 16:25:09
1393
2
原创 KEGG图
泡泡图r中作图输入文件类型library(ggplot2)setwd("F:/chip-seq/dongfeng/2021_8_11")library(readxl)f <- read_excel("KEGG-2.xls")FoldEnrichment=f$`Fold Enrichment`pathway=f$Termp = ggplot(f,aes(FoldEnrichment,pathway))p = p + geom_point(aes(size=Count))p1 =
2021-10-19 16:15:03
513
原创 rnaseq_dongfeng_overlapABC_heatmap
提要:本次实验给了我三个样品ABC,其中A是单端测序仅有一个文件,B,C为双端测序,有两个文件。给我的数据都是clean data,因此我没有进行质控,直接从STAR比对开始,然后利用了rsem进行转录本定量。利用DEseq2进行差异表达分析。其中分组为B相对与A上调的基因为upAB,B相对于C上调的基因为upBC。分别找到两组上调基因后去overlap共同的基因,然后将这些overlap到的基因做个火山图。寻找上调差异基因** 设计一个sampleAB,BC.txt的文件 **** 以及一个ge
2021-08-18 14:52:55
336
原创 从头chipseq
1.下载sra文件wget http……ncbi(data).sra2.将sra文件转为fastq文件fastq-dump --split-3 filename注:- -split-3 如果是双端测序则出现两个fastq文件,如果是单端测序则只有一个文件。得到的文件应该是fastq,下面非为两个方法去找后面的peak。一.nf-core-chipseq pipeline进行分析说明:该方法适用于有输入文件即input的chipseq分析,如果没有input文件则无法设计design.csv文
2021-08-06 09:43:11
1516
原创 2021-08-03
将sra文件转成fastq格式yuanye@DNA:~/projects/dongfeng/ChIP_seq/2021_7_29/data/fastq$ ~/software/sratoolkit.2.11.0-ubuntu64/bin/fastq-dump --split-3 SRR…….1将fastq格式压缩yuanye@DNA:~/projects/dongfeng/ChIP_seq/2021_7_29/data/fastq$ gzip -c SRR…….1_1.fastq > SRR…
2021-08-03 20:54:50
133
原创 conda环境更新——神速装软件
conda环境更新——神速装软件更新conda(base) yuanye@DNA:~/miniconda3$ cd(base) yuanye@DNA:~$ conda update -n base conda出现选项时选择yesProceed ([y]/n)? y结束时出现以下内容Preparing transaction: doneVerifying transaction: doneExecuting transaction: done当更新完毕后,查看一下conda版本
2021-06-14 17:43:27
943
原创 RNA-seq流程——使用hisat2进行序列比对(不利用循环&利用循环)(未完待续)
RNA-seq流程——使用hisat2进行序列比对(不利用循环&利用循环)(未完待续)本次使用ky老师的文件进行序列比对,比对时使用双端比对,_1.clean.fq.gz,_2.clean.fq.gz一、不利用循环进行比对1.进行比对前,首先将目录转到有.fq.gz的文件夹下hisat2 -t -p 8 -x /f/xudonglab/yuanye/reference/UCSC_mm10/hisat2_index/hisat2_index_mm10 \#最后的\一定要加,不然程序直接就运行了,包括
2021-06-14 14:58:28
3623
5
原创 RNA-seq做数据质控
本次我利用ky老师的数据进行第一次RNA-seq分析流程训练,本次的样品为DIPG4-3,4各两组RNA-seq做数据质控1.使用fastqc命令对数据进行质控首先进入存有数据的目录中,并对目录进行变量命名dir=/f/xudonglab/yuanye/projects/kongyu/RNA_seq/2021_02_22使用fastqc命令进行数据质控(base) yuanye@DNA:~/projects/kongyu/RNA_seq/2021_02_22$ fastqc -t 4 -o
2021-06-10 17:22:35
781
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人