简单脚本自动查询Phred质量分数编码系统

最新推荐文章于 2024-10-20 13:29:31 发布

原创

最新推荐文章于 2024-10-20 13:29:31 发布 · 497 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#r语言 #bash #ascii码表

本文介绍了一个利用脚本查询Phred质量分数编码的步骤，详细讲解了代码的每一部分，包括如何处理输入参数，提取数据，以及通过awk和od命令进行ASCII码到二进制的转换。主要涉及的工具有bash脚本、awk和od命令。

简单脚本自动查询Phred质量分数编码系统

修改自：
从零开始完整学习全基因组测序数据分析：第2节 FASTA和FASTQ

less $1 | head -n 1000 | awk '{if(NR%4==0) printf("%s",$0);}' | od -A n -t u1 -v \
| awk 'BEGIN{min=100;max=0;} \
  {for(i=1;i<=NF;i++) {if($i>max) max=$i; if($i<min) min=$i;}}END \
  {if(max<=126 && min<59) print "Phred33"; \
  else if(max>73 && min>=64) print "Phred64"; \
  else if(min>=59 && min<64 && max>73) print "Solexa64"; \
  else print "Unknown score encoding"; \
  print "( " min ", " max, ")";}'