今天遇到一个需求:
在一个文本中有上万的id,需要对这些id按照出现次数进行排序。
下面是一种实现方法:
cat ids.txt | sort | uniq -c | sort --key=1,7 -r -n > uids_sort.txt
其中 uniq -c 是对连续出现的id进行累计计算,并把总数放到前面。
sort --key=1,7 的作用是窃取结果的前七列进行排序, -r 是反序, -n是作为数字排序。
经过一系列的操作,即可得到结果id。
本文介绍了一种高效处理大量文本ID的排序方法。通过使用cat、sort、uniq-c及再次sort命令组合,实现了对文本中成千上万个ID按出现次数从高到低排序的需求。此方法适用于快速统计并排序大规模数据集中的元素频率。
今天遇到一个需求:
在一个文本中有上万的id,需要对这些id按照出现次数进行排序。
下面是一种实现方法:
cat ids.txt | sort | uniq -c | sort --key=1,7 -r -n > uids_sort.txt
其中 uniq -c 是对连续出现的id进行累计计算,并把总数放到前面。
sort --key=1,7 的作用是窃取结果的前七列进行排序, -r 是反序, -n是作为数字排序。
经过一系列的操作,即可得到结果id。

被折叠的 条评论
为什么被折叠?