真核有参转录组测序标准分析

最新推荐文章于 2023-12-05 18:29:23 发布

生信分析实验室

最新推荐文章于 2023-12-05 18:29:23 发布

阅读量1k

点赞数

文章标签： r语言开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45614728/article/details/120390624

版权

本文从分析者视角概述真核有参转录组测序的标准分析过程，包括从公司接收双端测序数据，服务器准备，数据质量检查，以及文件完整性验证。通过RNA-seq简介和数据处理步骤，指导如何处理和上传测序数据到服务器，并使用md5sum进行文件完整性检验。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本篇文章主要站在你是分析数据者的角度来讲解，一些测序建库的原理与操作我只做简要说明，甚至一笔带过。关于更多详细内容大家都可以百度了解。主要的篇幅是从公司拿到双端测序的fq.gz后的故事。

准备：一台服务器，参考基因组，基因注释文件。

RNA-seq简介

转录组测序数据产生(简述)

将表型特异的组织提取RNA，然后送到测序公司，经过质检合格后，开始在仪器中测序。数据下机，发到客户手里。

转录组测序数据量与下机数据(简述)

不同物种的基因数量与大小都不尽相同，因此具体情况具体分析，可以跟导师商量讨论后在做决定。以我所在的实验室为例，二倍森林草莓基因组220M，共计大约34000个基因，一个样品测序数据量选择6G(这里的数据量指的是原始数据中碱基的数量，不是文件大小)。另外，测序策略一般都是选择双端测序，建库类型选择真核普通转录组文库。若注释基因组，则选择真核链特异性文库(此文库以后的文章会讲)。

公司的下机数据都是rawdata形式的，这是最原始数据，其中包含一些质量不好的碱基，并且还有接头序列。一般会让公司做去除接头并且去除质量不好的reads，拿到cleandata数据，做这个操作好像一个样加10块(这几天送样做三代测序和二代基因组重测序，公司告诉我这个操作不要钱，都是直接给客户cleandata)。总之，我实验室的其他人都是直接告诉公司要cleandata。Rawdata自己也要保存一份。并且公司还有给一个md5.txt之类的文本(文件很重要，检查文件的完整性)。

测序数据上传到服务器

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。