1,第一列按照染色体编号进行排序,排序后应该是chr1, chr2, chr4, chr5, chr10, chr20, chrX. 使用-V
2, 第二列和第三列按照数字序进行排序。使用-n
sort -k1,1V -k2,2n -k3,3n target_interval.bed > sort.bed
其中-k选项是指定第几列。
基因组区间排序指南
本文详细介绍了如何使用sort命令对基因组区间文件进行排序的方法,包括按染色体编号及区间位置排序的具体操作,适用于生物信息学研究中的数据预处理。
1,第一列按照染色体编号进行排序,排序后应该是chr1, chr2, chr4, chr5, chr10, chr20, chrX. 使用-V
2, 第二列和第三列按照数字序进行排序。使用-n
sort -k1,1V -k2,2n -k3,3n target_interval.bed > sort.bed
其中-k选项是指定第几列。
3845
6097
3601