- 博客(14)
- 收藏
- 关注
原创 Featurecounts计数
左图为HTseq计算的结果,右图为featureCounts计算结果,两种计算结果是一样的,但featureCounts可以运算多个bam文件,速度更快,且可以形成表达矩阵。总结来说,这个命令将对指定的BAM文件集合进行读取计数,每条读取都会根据其覆盖的基因ID进行分组,并将结果输出到一个CSV文件中。FeatureCounts将读取这些文件中的比对数据,并根据注释文件中的信息计算每个基因的读取计数。: 指定提供的注释文件的格式,可接受的格式包括'GTF'(或兼容的GFF格式)和'SAF'。
2024-03-23 21:10:46
4545
原创 fastq文件预处理(fastp和multiqc)
multiqc ..代表在当前文件夹生成报告--outdir(-o): 在指定的输出目录中创建报告。--title(-i): 报告标题。作为页面页眉打印,如果没有特别指定,则用于文件名。
2024-03-23 14:14:35
2701
原创 RNA-seq差异表达分析绘图(MA图、火山图)
这个参数设置了y轴的界限,即对数变化值的范围。在这个例子中,y轴的范围被限制在-10到10之间。这通常用于放大图中的某些区域,使得变化较大的基因更容易观察。
2024-03-21 23:25:43
3050
原创 R上差异表达分析(准备、整合、过滤、样本离群值可视化分析)
定义文件编号# 格式化文件编号为2位数字符串# 生成完整的样本编号# 定义一个函数来读取和处理每个样本文件# 使用lapply读取所有样本文件,结果存储在一个列表中# 检查所有样本文件是否具有相同的行数if (!# 使用do.call和cbind将列表中的所有数据框按列合并,coun_table可以替换自己想输出的名字# 设置合并后的数据框的列名为样本编号。
2024-03-17 21:39:07
1995
原创 Linux下载jdk17
输入tar -zxvf jdk-17.0.10_linux-x64_bin.tar.gz 解压,会看到一个jdk-17.0.10目录,这就是jdk17的安装目录。在文件的末尾加上两行,将/home/lumino/tool/jdk-17.0.10 替换为bin文件所在路径。ubuntu虚拟机复制带linux-x64.tar.gz的,输入以下代码。进入jdk下载网站获得最新jdk17下载地址。保存并关闭文件(ctrl-o后ctrl-x)输入 java -version确认是否激活。编辑shell配置文件。
2024-03-16 00:06:18
2612
原创 Linux的RNA-seq分析(stringtie-FPKM和HTseq计数)
确保安装了stringtie如果要研究新的转录本,则需要完成所有样本的转录本的组装并整合在stingtie-merged.gtf中,详细见Linux系统RNA-seq分析(stringtie转录本组装)。新建SRR3418005_FPKM子文件夹,并在其中打开终端:这个选项告诉stringtie不仅要输出组装得到的转录本,还要输出那些表达量较低、可能不被认为是完整转录本的“额外”转录本片段。这有助于捕获那些可能只部分被测序覆盖的转录本区域。-p 2:这个选项指定了stringtie。
2024-03-15 21:19:56
2912
原创 RNA-seq数据分析(分析策略,比对,转录组组装,转录本定量)
分析策略通过综合分析RNA-seq分析流程中不同步骤的工具性能发现不同的分析工具和方法对分析结果的准确度和分析时间影响巨大。HISAT2表现出最快的速度和最准确的拼接比对,但是没有STAR的敏感度高。StringTie在速度和准确度上都优于Cufflinks。长读段方法如IDP和Iso-Seq会识别许多短读段技术没有识别到的多外显子转录本,但是会丢失一些单外显子转录本。通常,在从头组装工具中,Oases表现最佳。不经过比对的工具如和kallisto。
2024-03-13 21:48:54
6518
原创 Linux系统下RNA-seq分析(利用bowtie2比对)
3.bowtie2-build 是用来建立索引的命令,/home/lumino/TEST1/TEST1.1/tair10.fa 是你的基因组 FASTA 文件的路径,tair10 是你希望为索引文件使用的前缀。综上所述,从提供的数据来看,这些数据的质量在映射率和读取长度方面看起来是合理的,但还需要进一步的质量控制分析来确认其完整的质量状况。: 没有次级对齐的 reads,这通常表示数据中的 reads 都是唯一的,没有来自重复区域或高度相似区域的 reads。则指定了输出SAM格式文件的路径和名称。
2024-03-12 01:28:30
1830
原创 Conda下载生物信息学工具
总的来说,Cufflinks是一个功能强大的工具,适用于RNA-Seq数据的转录本组装和表达水平分析,为研究人员提供了丰富的功能和可视化工具,帮助他们深入理解基因表达调控的机制。表达水平估计:Cufflinks可以根据RNA-Seq数据估计基因和转录本的表达水平,提供FPKM(每百万读数的碱基数)和TPM(每百万转录本的碱基数)等表达水平指标。转录本组装:Cufflinks可以根据RNA-Seq数据对转录本进行组装,包括检测新的转录本、识别外显子边界和连接外显子,从而重建基因的转录本结构。
2024-03-11 00:22:22
739
原创 Linux系统下RNA-seq分析(2.STAR比对和cufflinks拼接)
提示:这里对文章进行总结:例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
2024-03-10 20:52:46
2562
原创 Linux系统进行RNA-seq分析(数据预处理)
提本案例数据来自GSE80565,本实验选取两组数据,SRR3418005,SRR3418006,SRR3418019,SRR3418020.
2024-03-07 22:23:56
1536
整合不同样本reads计数到同一txt
2024-03-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人