如何从文件中快速找到出现频率次数最多的用户？

最新推荐文章于 2023-01-02 17:18:12 发布

hbcfxg

最新推荐文章于 2023-01-02 17:18:12 发布

阅读量480

点赞数

CC 4.0 BY-SA版权

分类专栏： C语言文章标签： awk php

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/hbcfxg/article/details/84533831

C语言专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一种处理大型用户日志文件的方法，当文件大小超过服务器内存容量时，如何通过将大文件分割成小文件，并使用shell脚本配合awk进行处理，最终找出出现次数最多的用户ID。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目前有一个2G的用户日志文件，服务器内存1G，日志里面每行存着一个用户ID(7-10），怎么最快找出出现过最多次的用户ID?

1:先用 split切割成小文件
split -l100000 file newfile
2：遍历切割后的文件
for file in *.log
do
awk '{{a[$2]++}END{for(t in a) print a[t],t}}' file >> coutfile.log
done
awk '{a[$2]+=$1}END{{l=asorti(a,b);for(i=l;i>=1;i--)print b[i],a[b[i]]}' countfile.log
如果coutfile还是大可以在循环中处理下让他排重几次

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。