查看访问最频繁的前100个IP
awk ‘{print $1}’ access_temp.log | sort -n |uniq -c | sort -rn | head -n 100
统计访问最多的url 前20名
cat access_temp.log |awk ‘{print $7}’| sort|uniq -c| sort -rn| head -20 | more
基础
awk 是文本处理工具,默认按照空格切分,$N 是第切割后第N个,从1开始
sort命令用于将文本文件内容加以排序,-n 按照数值排,-r 按照倒序来排
案例的sort -n 是按照第一列的数值大小进行排序,从小到大,倒序就是 sort -rn
uniq 去除重复出现的行列, -c 在每列旁边显示该行重复出现的次数。

本文介绍如何使用awk、sort和uniq工具统计access_temp.log文件中访问最频繁的前100个IP地址及访问最多的前20个URL,揭示了文本处理在网站流量分析中的应用。
452

被折叠的 条评论
为什么被折叠?



