文本三剑客之AWK

awk是一种强大的文本分析工具,它逐行读取文本并按字段处理。常见内建变量包括$0(整行内容)、NR(行号)、$n(字段)、FS(列分割符)等。awk命令格式涉及模式和操作,BEGIN和END用于预处理和后处理。文章还展示了awk在查看内存使用率和CPU空闲率等实际应用中的用法。

目录

1.AWK工具介绍

2.AWK工作原理

3.AWK命令格式

4.AWK常见的内建变量(可直接使用)

 1.$0 当前处理的行的整行内容

 2.NR处理指定行内容

 3.使用BEGIN输出包含指定字符的行并统计有多少行 

 4.$n 当前处理行的第n个字段

 5.FS(-F)列分割符,指定每行文本的字段分隔符 

  6.OFS输出内容的列分隔

  7.NF当前处理的行的字段个数 

  8.RS行分隔符 

5.AWK实列

     1.查看内存使用率

2.查看CPU空闲率

3.AWK的定义与引用


1.AWK工具介绍

   (1)AWK 是一种处理文本文件的语言,是一个强大的文本分析工具;

   (2)可以在无交互的模式下实现复杂的文本操作;

   (3)相较于sed常作用于一整个行的处理,awk则比较倾向于一行当中分成数个字段来处理,因为awk相当适合小型的文本数据。

2.AWK工作原理

(1)逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。
(2)awk倾向于将一行分成多个"字段"然后再进行处理。
(3)awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。
(4)使用awk命令的过程中,可以使用逻辑操作符"&&"表示"与"、"|"表示"或"、"!"表示"非",还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。

3.AWK命令格式

awk 选项 '模式或条件 {操作}' 文件1 文件2 ....
 
或者
awk -f 脚本文件 文件1 文件2 .....

 

4.AWK常见的内建变量(可直接使用)

内建变量作用
$0当前处理的行的整行内容。
NR当前处理的行的行号(序数)
$n 当前处理行的第n个字段(第n列)
FS 列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同
OFS输出内容的列分隔符
NF当前处理的行的字段个数      $NF代表最后一个字段
FILENAME被处理的文件名
RS行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录, 而awk一次仅读入一条记录进行处理。预设值是'\n '

     1.$0 当前处理的行的整行内容

 

     2.NR处理指定行内容

     (1)使用数字处理行内容

 

 

(2)使用字符串处理行内容 

 

(3)打印行号

 

3.使用BEGIN输出包含指定字符的行并统计有多少行 

awk 'BEGIN{ ..};{..} ;END{.. .}' 文件

(1)BEGIN模式表示,在处理指定的文本之前,需要先执行BEGIN模式中指定的动作;

(2)awk再处理指定的文本,之后再执行END模式中指定的动作;

(3)END{ } 语句块中,往往会放入打印结果等语句。

awk 'BEGIN{x=0};/\/bash$/{x++};END {print x}' /etc/passwd
统计以/bin/bash 结尾的行数,等同于grep -c "/bash$"

 以:为行分隔符,进行统计行号

 

4.$n 当前处理行的第n个字段

 

$n ~ "字符串"   代表打印出第n个字段中包含某字符的行
$n =="字符串"   代表打印出第n个字段中为某字符串的行
 
$n != "字符串"   代表打印出第n个字段中不为某字符的串行

示例:

#打印出第一字段中包含root的行中的第一列于第3列
 
awk -F: '$1~"root"{print $1,$3} ' /etc/passwd

5.FS(-F)列分割符,指定每行文本的字段分隔符 

awk -F 分隔符 '{操作}'

 与!一起使用

 

6.OFS输出内容的列分隔符

  将空格换为“|”

 

 7.NF当前处理的行的字段个数

     打印第一个字段与最后一个字段

 

 

8.RS行分隔符 

 

5.AWK实列

 1.查看内存使用率

 

2.查看CPU空闲率

  top -b -n 1 只会输出一次top的结果 不会进行刷新

3.AWK的定义与引用

调用函数getline,读取一行数据的时候并不是得到当前行而是当前行的下一行 

显示奇数和偶数行

 

 

<think>嗯,用户想学习或练习Linux下的awk用法,需要提供示例和教程。首先,我得回忆一下awk的基本概念和工作原理。记得awk是一种文本处理工具,逐行处理数据,按字段进行操作。用户可能需要从基础开始,逐步深入。 然后,看看用户给的参考引用。引用[1]提到awk的工作原理,引用[2]展示了一个打印字段的例子,引用[3]则是一些更复杂的应用,比如处理ifconfig的输出。这些例子应该可以拆解成不同的练习题目,帮助用户逐步掌握。 接下来,得确保回答结构清晰。先介绍awk的基本用法,再提供由浅入深的示例。比如,从打印特定字段开始,到条件过滤、计算统计,再到文本处理的高级技巧,比如处理多行记录或正则表达式匹配。 还要注意用户的练习需求,可能需要实际问题来练习。例如,处理学生成绩表、日志分析、系统信息提取等,这些实际场景能帮助用户巩固知识。同时,结合参考中的例子,比如处理ifconfig的输出,可以设计相应的练习题。 另外,用户提到的示例中的多行处理(使用RS变量)和字段处理(FS变量)也很重要。需要详细说明这些概念,并提供示例代码和解释,确保用户理解如何修改记录分隔符和字段分隔符。 最后,生成相关问题,帮助用户进一步探索awk的高级功能,比如性能优化、复杂文本处理等。还要确保所有命令和示例符合LaTeX格式要求,行内公式用$...$,独立公式用$$...$$,并且正确引用来源。</think>### Linux awk 基础与进阶练习指南 ### 一、awk 基础用法 1. **核心原理** awk 按记录(默认行)处理文本,每条记录自动分割为字段(默认空格分隔),支持模式匹配与动作执行[^1]。基本结构: ```bash awk 'pattern {action}' file ``` 2. **字段操作示例** ```bash awk '{print $1, $3}' data.txt # 输出第1和第3列[^2] awk -F: '{print $1,$6}' /etc/passwd # 使用冒号分隔符 ``` ### 二、进阶练习示例 #### 1. 条件过滤 ```bash # 筛选成绩大于80的学生 awk '$3 > 80 {print $1, $3}' scores.txt # 排除空行 awk '!/^$/ {print}' log.txt ``` #### 2. 数值计算 ```bash # 计算文件总行数 awk 'END {print NR}' data.txt # 求第2列平均值 awk '{sum+=$2} END {print sum/NR}' numbers.txt ``` #### 3. 多字段处理 ```bash # 组合字段输出 awk '{print "用户:" $1, "UID:" $3}' /etc/passwd # 字段重排(交换第2、3列) awk '{tmp=$2; $2=$3; $3=tmp; print}' data.txt ``` #### 4. 系统信息提取(参考[^3]) ```bash # 获取所有IPv4地址(排除127) ifconfig | awk '/inet / && !($2 ~ /^127/) {print $2}' # 统计TCP连接数 netstat -ant | awk '$6 == "ESTABLISHED" {count++} END {print count}' ``` ### 三、高级技巧 1. **多行记录处理** 修改记录分隔符 `RS`: ```bash awk 'BEGIN{RS=""; FS="\n"} {print $2}' multi.txt # 处理段落格式数据 ``` 2. **数组应用** ```bash # 统计词频 awk '{for(i=1;i<=NF;i++) words[$i]++} END {for(w in words) print w, words[w]}' text.txt ``` 3. **正则表达式匹配** ```bash # 匹配带版本号的行 awk '/[0-9]+\.[0-9]+\.[0-9]+/ {print}' version.log ``` ### 四、实践项目 1. **日志分析** 分析 Nginx 访问日志: ```bash awk '$9 == 404 {print $7}' access.log | sort | uniq -c | sort -nr ``` 2. **数据报表生成** ```bash awk 'BEGIN{print "姓名\t总分"} {sum=$2+$3+$4; print $1 "\t" sum}' scores.txt ``` 3. **系统监控脚本** ```bash df | awk '$5 > 80 {print "警告: " $1 " 使用率 " $5}' ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值