强大的awk 更适合格式化文本，对文本进行较复杂格式处理

最新推荐文章于 2025-06-10 14:19:38 发布

原创最新推荐文章于 2025-06-10 14:19:38 发布 · 486 阅读

0 ·

CC 4.0 BY-SA版权

linux 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了Linux下grep、sed和awk三个强大的文本处理工具，分别适用于查找匹配文本、编辑文本和格式化处理复杂文本。通过示例展示了如何使用awk找出文本文件中出现频率最高的IP地址和用户名。

grep 、sed、awk被称为linux中的"三剑客"。

我们总结一下这三个"剑客"的特长。

grep 更适合单纯的查找或匹配文本

sed 更适合编辑匹配到的文本

awk 更适合格式化文本，对文本进行较复杂格式处理

这样描述还看不出awk的强大之处，直接上面试题吧

题目简单，就是找到第一列中出现最多的ip,第二列中出现最多的用户名，之前的grep,sed无从下手，vi/vim更加不可能，怎么办呢，这时就需要强大awk了。这里我先给出答案，千万不要看到答案就晕了。再细讲awk的功能

1、找到第一列中出现最多的ip，命令如下：

awk 'BEGIN{max_h=0}{hostname[$2]++;};END{for(i in hostname){if(hostname[i]>max_i){max_i=hostname[i];ip_m=i}}print max_i,ip_m;}' awk.txt

2、第二列中出现最多的用户名，命令如下：

[test@iZ2zejcroqcaascckrpnw5Z log]$ more awk.txt

1.1.1.1 st_000012 ajgoahgoahgoahgghg2.2.2.2 st_000014 ajgoaoghaughughgu3.3.3.3 st_000015 alfjoigrhuogrub4.4.4.4 st_000016 ajgoaghkaahgoahgghg1.1.1.1 st_000019 ajgoalllllghughgu5.5.5.5 st_000015 alfjoigrhuogru[test@iZ2zejcroqcaascckrpnw5Z log]$ awk 'BEGIN{max_h=0}{hostname[$2]++;};END{for(i in hostname){if(hostname[i]>max_i){max_i=hostname[i];ip_m=i}}print max_i,ip_m;}' awk.txt2 st_000015

估计好多小伙伴已经晕了