若参考基因组序列不包含chr*random 和 chrUn序列,原来属于chrrandom 和 chrUn的read可能比对到chr1-22,chrX,chrY上相似区域,造成假阳性比对,后续这些reads提供的信息不可靠。通过增加这一部分参考序列,使来自这些区域的reads正确比对,减少假阳性。后续分析不考虑chrrandom 和 chrUn*。
human GRCh37
“unlocalized sequences”:知道染色体但不知具体位置的序列
“unplaced sequences”:知道来自人类基因组序列,但不知与染色体的关系
“alternate loci”:来自基因组特定区域,代表该区域序列的多样性
human hg19…
“chr*_random sequences” : 知道来自哪条染色体但不知具体位置的序列
The chr*_random sequences are unplaced sequence on those reference chromosomes.
“chrUn_* sequences” : 知道来自人类基因组序列,但不知与染色体的关系
The chrUn_* sequences are unlocalized sequences where the corresponding reference chromosome has not been determined.
高粱super,玉米scoffol

最低0.47元/天 解锁文章
1042

被折叠的 条评论
为什么被折叠?



