
测序
文章平均质量分 79
长腿猴子请来的救兵
这个作者很懒,什么都没留下…
展开
-
cut&tag学习笔记
上图是我得到的结果,下图是教程的结果,比对结果有一些差异,我也不知道具体原因是啥。谷歌了一下,发现原因可能是因为环境变量的问题,系统不知道picard的具体位置,需要设置全局环境变量,遂查了一下picard的位置。我发现我做出来的结果测序深度一致,但是比对的结果有一点差异,不知道是我的操作问题,还是参考基因组更新了导致比对结果出现了些许不同。上图是我得到的结果,下图是教程的结果,除了IgG_rep1外比对结果一致。上图是我的结果,下图是教程的结果,结果不太一致,不知道是具体的原因是什么。原创 2024-05-13 19:07:41 · 1489 阅读 · 0 评论 -
转录组学习第5弹-比对参考基因组
在构建文库的过程中需要将DNA片段化,因此测序得到的序列只是基因组的部分序列。为了确定测序reads在基因组上的位置,需要将reads比对回参考基因组上,这个步骤叫做比对,即文献中所提到的alignment或mapping。包括基因组比对和转录组比对目前比对的工具有很多,这里用的是hisat2。原创 2023-11-25 10:13:51 · 1069 阅读 · 1 评论 -
转录组学习第四弹-数据质控
reads每个位置的颜色显示由4种颜色的比例混合而成,哪一个碱基的比例大,则趋近于这个碱基所代表的颜色。由下图可知32个样本的ATCG的含量比例是比较均匀的,测序质量是可以的。一条序列的重复数,因为一个转录组中有非常多的转录本,一条序列再怎么多也不太会占整个转录组的一小部分(比如1%),如果出现这种情况,不是这种转录本巨量表达,就是样品被污染。正常情况下,N值非常小。绿色区间——质量很好,橙色区间——质量合理,红色区间——质量不好。绿色区间——质量很好,橙色区间——质量合理,红色区间——质量不好。原创 2023-11-21 20:47:28 · 490 阅读 · 1 评论 -
转录组学习第三弹-下载SRR数据并转成fastq
前面已经安装好了需要的软件,那么我们现在需要下载我们练习需要用到的sra数据。可以用ascp快速的来下载 sra 文件,也可以用wget或curl等传统命令从 FTP 服务器上下载 sra 文件。下载完之后可以检查一下数据大小,这里数据大小是没问题的,如果遇到大部分数据是1-3G,有个别数据是200多M的,那就要检查一下是不是下载不完整。挂服务器后台下载,因为没有用上ascp,所以这里是通过HTTPS方式下载的,下载速度很慢,就晚上放着第二天早上下完就行。写于2023年11月20日。原创 2023-11-20 13:48:01 · 1541 阅读 · 1 评论 -
转录组测序学习第二弹
同理继续安装tophat和htseq,发现htseq成功了,但是tophat失败了,提示需要在python2.7的环境下才能安装,于是又进行了下面的尝试。安装成功了,尽管一开始还是unsuccessful,但是等了一会就可以了,还是源不稳定的问题啊!谷歌之后发现可能是源的问题,经咨询后建议我把清华的源换成北外的源,于是我就尝试了以下操作。2)重新安装tophat,安装成功,但是以后就得2个环境切换着用了,有点麻烦。前面已经安装好了conda,那么我们现在需要安装我们后续需要用到的软件。原创 2023-11-15 22:59:06 · 823 阅读 · 1 评论 -
macOS使用conda初体会
最近在扫盲测序的一些知识其中需要安装一些软件进行练习,如质控的fastqc,然后需要用conda来配置环境变量和安装软件。记录一下方便后续查阅学习。原创 2023-11-12 17:03:32 · 2180 阅读 · 1 评论