linux命令awk

本文介绍Awk编程语言的基础知识,包括其基本功能、调用方式、内置函数等,并通过实例展示了如何利用Awk进行文本处理。

awk

awk是一种编程语言,对文本和数据进行处理,支持正则表达式,突出特点是对文本列的处理。

awk基本功能:在文件或字符串中基于指定规则来分解抽取信息,也可以基于指定规则来输出信息。

 

awk的调用方式

(1)

awk [option] 'awk_script' inputfile1 [inputfile2...]
选项:
-F fs          使用fs作为字段分隔符,默认为Space
-f filename    从文件中读取awk脚本
-v var=value   为awk_script设置变量

(2)将awk_script放入脚本文件,并以 !#/bin/awk –f 作为首行

(3)将所有awk_script写入到一个单独脚本文件,然后调用“awk  –f  awk脚本文件  输入文件列表”进行执行

 

记录和域

(1)域分隔符

域分隔符:默认为Tab。内置变量FS

输出域分隔符:默认为Space。内置变量OFS

修改方法:

awk –F '[:\t]' '{print $1,$3}' passwd

(2)记录:一行为一个记录

记录分隔符:默认为换行。内置变量ORSRS

变量NR:计数器(记录行号)

例:

awk '{print NR,$0}' grade.txt

(3)域:一列为一个域

域标志顺序为$1,S2,…,$n。$0表示整条记录,$n表示第n列

域之间的分隔符默认为Space或Tab,可以使用-F参数修改。

例:

awk '{print $1,$3}' grade.txt

 

awk脚本

awk脚本由模式和操作组成。

awk命令的一般格式:

awk 'BEGIN {action}
awk_pattern1 {action}
awk_pattern2 {action}
awk_patternN {action}
END {action}'
inputfile

awk内置函数:

函数

函数说明

gsub(r,s)

在整个$0中用s代替r

gsub(r,s,t)

在整个t中用s代替r

index(s,t)

返回s中字符串t的第一位置

length(s)

返回s长度

match(s,r)

测试s是否包含r字符串

Split(s,a,fs)

用fs作为分隔符将s分成序列a

sprint(fmt,exp)

返回fmt格式化后的exp

sub(r,s)

用$0中最左边最长的r子串代替s

substr(s,p)

返回字符串s中p开始的后缀部分

substr(s,p,n)

返回字符串s中p开始,长度为n的后缀部分

 

 awk变量

(1)变量不需要定义可以直接使用

(2)awk赋值语句为“var=exp

awk '$1 ~/test/{count=$2+$3;print count}' test

(3)域变量可被赋值和改变。

     例如:awk ‘{$2=$1+100;print $2}’ test

(4)可以使用内置变量。

     例如:awk ‘{if($1==”MARY”)  {print NR,$1,$2,$NF}}’ test

 

### Linux `awk` 命令使用教程 #### 什么是 `awk` `awk` 是一种强大的文本处理工具,在 Linux 和 Unix 系统中广泛用于解析和操作结构化数据文件。它能够按照指定条件筛选、提取以及格式化输出数据[^1]。 #### 基本语法 `awk` 的基本命令格式如下所示: ```bash awk [选项] '脚本' 文件名 ``` 其中,“脚本”部分通常由模式匹配和动作组成,形式为 `{action}` 或者 `pattern {action}`[^2]。 #### 结构化的执行流程 完整的 `awk` 脚本可以分为三个主要部分:`BEGIN` 部分(初始化)、主循环体(针对每一行的操作),以及 `END` 部分(总结)。其通用模板如下: ```bash awk 'BEGIN {commands} pattern {commands} END {commands}' filename ``` 这里,`BEGIN` 中的内容会在任何输入被读取之前被执行;而 `END` 则是在所有记录都已处理完毕之后才运行[^3]。 #### 实际应用案例 ##### 示例 1: 过滤特定字段的数据 假设有一个日志文件名为 `log.txt` ,我们希望找出第一列数值大于2的所有行,则可采用以下方法实现: ```bash $ awk '$1>2' log.txt # 输出样例: 3 Do you like awk This's a test 10 There are orange,apple,mongo ``` 此命令会打印出满足 `$1 > 2` 条件的所有行[^4]。 ##### 示例 2: 统计每行字符数并附加到原行后面显示 如果想要计算每行的长度并将该信息追加至对应行末尾展示出来的话,可以用这个技巧完成任务: ```bash $ awk '{print $0, length($0)}' example_file ``` ##### 示例 3: 访问内置变量 利用一些预定义好的特殊变量可以帮助更灵活地控制程序行为。比如通过访问 NF (number of fields),我们可以轻松获取当前行有多少个字段; 或者借助 NR (number record), 可知目前正处理的是第几条记录等等。 #### 注意事项 当需要清理系统的交换空间时,请勿混淆与上述提到有关于 `awk` 功能无关的操作指令。例如下面这条语句是用来关闭再重新开启所有的swap设备,并不是用来做数据分析工作的: ```bash # swapoff -a && swapon -a ``` 这应该单独作为维护系统性能的一部分来考虑[^5]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值