问题
计算KEGG通路时,我们会得到每个节点的一个/多个/全部的KO号,这种情况下应该怎么计算每个途径的完整性呢?
解决
awk -F"\t" 'NR>1{print $6}' ReporterScore_KO_htable.txt|sort|uniq >pathway3.uniq
while read -r line; do grep "$line" /share/pasteur/luosn/database/kegg/ReporterScore_KO_htable.txt |awk -F"EC:" '{print $2}'|sed 's/ /\n/g'|sed 's/]//'|sort |uniq -c |awk -F" " '{count=$1;$1="";print $0"\t"count}'|sed 's/ //'|awk -F"\t" -v line="$line" 'BEGIN{a=0;b=0} NR==1 {a=$2} NR>1 {b+=1} END{print line"\t"a+b}';done < pathway3.uniq > pathway3.nodes_stats