
生物信息学
BaldStrong
这个作者很懒,什么都没留下…
展开
-
fastq、fasta、sam数据格式
FastQFASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。它们都是以ASCII编码的。现在几乎是高通量测序的标准格式。fastq格式是生物信息分析中最常见的格式之一通常我们可以将测序的数据分为双端测序和单端测序双端测序的数据含有两个fastq格式的文件,单端测序的数据只有一个fastq格式的文件fastq格式的文件详解如下图:主要分为四行第一行是用来区...原创 2019-07-12 18:17:45 · 3011 阅读 · 0 评论 -
Minimap2简介
http://www.360doc.com/content/19/0122/19/52645714_810653684.shtmlMinimap2是知名比对工具BWA的开发者Li Heng新开发的比对工具,它能够快速的将DNA或者mRNA序列比对到参考基因组上,使用场景有下面几种:将PacBio或OXford Nanopore的read和已有参考基因组(如人类)进行比对寻找高错误率read...转载 2019-07-12 18:20:16 · 9162 阅读 · 1 评论 -
samtools使用
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtmlsamtools是一个用于操作sam和bam文件的工具合集。包含有许多命令。以下是常用命令的介绍1. viewview命令的主要功能是:将sam文件转换成bam文件;然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作 是对bam文件进行的,因...原创 2019-07-12 18:20:55 · 746 阅读 · 0 评论 -
生信知识与软件小结:BWA、wtdbg
三代组装软件:canu、smartdenovo、wtdbg三代矫正软件:Racon、NanopolishFalcon: 一个实验性的二倍体组装工具,测试multi Gb genomes。Canu :Celera Assembler的一个分支,专门用于高噪音单分子测序。blast :的全称是 basic local alignment search tool 是一种极其常见的序列比对工具。其...原创 2019-10-05 15:01:34 · 4518 阅读 · 0 评论 -
序列信息统计
序列信息统计1.序列碱基含量seqkit fx2tab -l -g -n -i -H test.fa#name seq qual length GCctg1 4636403 50.73ctg2 9252 46.58ctg3 6861 54.23ctg4 5859 60.33ctg5 4929 52.262.序列长度的整体分布统计seqk...原创 2019-10-05 15:03:20 · 332 阅读 · 0 评论