
bioinformatics
whiffen_cann
这个作者很懒,什么都没留下…
展开
-
修改/替换bam文件的header
3,根据自己的目的,用vi ,sed等方式修改old_header.sam ,假定新的header 文件命名为 new_header.sam。原创 2024-04-16 18:58:14 · 499 阅读 · 0 评论 -
GATK使用方法详解(原始数据的处理)
转自:https://www.plob.org/article/7009.html1. 对原始下机fastq文件进行过滤和比对(mapping)对于Illumina下机数据推荐使用bwa进行mapping。Bwa比对步骤大致如下:(1)对参考基因组构建索引:例子:bwa index -a bwtsw hg19.fa。最后生成文件:hg19.fa.amb、hg19.fa.an转载 2017-02-22 14:50:10 · 12912 阅读 · 0 评论 -
fastq文件格式处理工具系列学习
转自:http://ju.outofmemory.cn/entry/215236fastq文件格式说明(wiki)FASTQ_format 维基百科NSC_2011_Illumina_fastqAndQC Illumina fastq 格式官方文档fastq 文件质量控制fastqc CommandLine Demo:./FastQC/fastqc -o转载 2017-02-22 14:54:16 · 11970 阅读 · 0 评论 -
fastq :怎么判断fastq是Phred33格式还是Phred64 格式
现在的一般都是Phred33的吧。。如果质量值对应的ASIIC码的值,有比64小的,那么他就是Phred33.如果有比73大的,那么就是Phred64体系的。这么说对吧?不对的请指正。以下属于转载:最近在学习质控知识时, 对于质量值体系及转换产生了一些疑问, 作了一些尝试, 趁集群故障, 在此总结一下质量值体系相比之前培训时所学的质控内容, (我拿到的) 流程中还多了一步 phred33t转载 2017-02-22 17:29:42 · 11417 阅读 · 0 评论 -
bam deal
pibase tools for validational and comparative analysis of BAM filespibase is an open-source package of linux command line tools for validating next-generation sequencing loci (SNPs and loci of interes原创 2017-02-24 14:08:13 · 816 阅读 · 0 评论 -
GATK best practices对variation(only for SNPs and Indels)的鉴定以及对上游数据对处理
借助网上的图用下,表表意思(只需要看图和粗体字,小字不用注意):看完图来说话,其实你看我这篇文章,目的就是想看gatk best practices 分析的全过程,按先后顺序,给你好看。预处理过程,开始于raw data,可以上fq,也可以上uBAM,并最终产生一个用于call variantion 的bam文件。预处理过程是纠正技术带来的偏差,使数据更适用于变异检原创 2016-05-24 15:40:56 · 3172 阅读 · 0 评论