使用awk统计分析

最新推荐文章于 2024-09-20 17:59:07 发布

原创

最新推荐文章于 2024-09-20 17:59:07 发布 · 753 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#linux

awk是一个强大的文本分析工具，它能按行读取文件，以空格或自定义分隔符分割每行，并对每个域进行处理。文章介绍了awk的基本用法，如BEGIN和END块，以及如何通过$0,$1等获取域值。还提供了两个案例，分别是统计/etc/passwd中各类型shell的数量和日志文件中每个IP的出现次数，展示了awk在数据分析中的应用。

一：awk 简介

awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据的分析并生成报告时显得尤为强大，简单说就是awk把文件逐行读入，以空格为默认分隔符，将每行切片，切开的部分再进行分析处理，因为切开的部分使用awk可以定义变量，运算符，流程控制语句进行深度加工与分析。
awk分解行记录,获取每一个域的记录
域:根据指定符号,把一行记录分解成多个小记录,每个小记录成为域，记录:一行数据
awk 分解记录:
1.awk -F 分解符号
2.awk 默认按照""分解
awk 获取每个域值:
$0:获取一行记录(所有域)
$1:获取第一个域的值
$2:获取第二个域的值
$n:获取第n个域的值

awk 语句组成部分:
1.BEGIN :表头
2.表的数据
3.END:表尾

[root@host ~]# cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

[root@host ~]# awk 'BEGIN{print 1/2} {print "ok"} END{print "--------