15、测序数据处理全流程解析

测序数据处理全流程解析

1. BAM文件数据解读

测序数据处理中,制表符分隔的条目包含了丰富信息,如序列标识符(成对读取的标识符相同)、读取映射到的染色体及位置、其配对读取的相同信息、CIGAR字段、标志、映射质量得分以及原始片段长度。

例如,示例序列映射到7号染色体的117559533位置,其配对读取映射到同一染色体的117559783位置。CIGAR 67M3D83M表示67 + 83 = 150个核苷酸与基因组参考完美匹配(M),中间有3bp的缺失(D)。标志99表示这是配对读取中的第一个读取,且两个读取都已映射。映射质量得分60(最高分)表明映射质量极佳,片段大小估计为400个核苷酸,处于正常范围。

BAM文件字段的定义可在 samtools.github.io/hts - specs/SAMv1.pdf 的第6页找到,标志字段值的解释可参考 broadinstitute.github.io/picard/explain - flags.html

2. 下载和安装GATK软件

我们将使用Broad Institute推荐的最佳实践,并使用流行的Genome Analysis ToolKit(GATK)软件来处理对齐的测序读取。以下是下载和安装GATK软件的步骤:
1. 访问

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值