生信-cufflinks输入输出文件分析

本文介绍转录组数据分析中产生的三个核心文件:转录组的组装.gtf,转录本表达水平.fpkm_tracking,基因表达水平.fpkm_tracking。详细解释了.gtf文件的结构,包括染色体来源、程序来源、结构类型、位置信息、链方向、得分、属性如geneid, transcript_id, FPKM等关键信息。

转自:https://wenku.baidu.com/view/8d6a95d20d22590102020740be1e650e52eacf2a.html

 输出包含3个文件:转录组的组装.gtf      转录本表达水平.fpkm_tracking      基因表达水平.fpkm_tracking  

1.转录组的组装.gtf   ——transcripts.gtf

转自:http://yangl.net/2016/06/03/cufflinks/

1.chrX来源染色体名称

2.来源,产生此文件的程序

3.结构,常为transcript或exon

4.开始

5.结束

6.得分

7.Cufflinks猜测isoform来自参考序列的那一条链,一般是'+','-'或'.'; 

8. Cufflinks不去预测起始或终止密码子框的位置 

9及以后是attribute的位置:

geneid;transcript_id;FPKM(Fragments Per Kilobase of exon model per Million mapped fragments)

frac 保留着的一项,忽略即可,以后可能会取消这个;conf_lo isoform丰度的95%置信区间的下边界,即 下边界值 = FPKM * ( 1.0 - conf_lo ) ; 

conf_hi isoform丰度的95%置信区间的上边界,即 上边界值 = FPKM * ( 1.0 + conf_hi ) ; 

cov 计算整个transcript上read的覆盖度;   

full_read_support yes 当使用 RABT assembly 时,该选项报告所有的intr ons和exons是否完全被reads所覆盖

转载于:https://www.cnblogs.com/BlueBlueSea/p/9869810.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值