awk用法简介

转载链接:https://chhy2009.github.io/2017/07/08/awk/

与sed工具类似,awk是一种优秀的行文本处理工具。其具有内置的变量和函数,可以进行正则表达式的匹配,流程控制,数学运算。事实上,可以说awk是一种编程语言。

awk程序结构

任何awk语句都由模式(pattern)及动作(action)组成。其中模式是一组用于测试输入行是否需要执行动作的规则,动作则是找到匹配内容后的执行动作(包含语句、函数和表达式的执行过程)。调用方式
awk [-F field-separator] 'pattern{action}' filename 其中,pattern和action都可以省略不写。无pattern默认匹配全部的记录;而无action则是打印原始记录。简单的AWK表达式之外,pattern可以是BEGIN或END;这两种条件对应的action分别是读取所有的记录之前和之后。 filename可以用|输入替代。

几个概念

  1. BEGIN 及 END 语句
    awk定义了两个特殊字段BEGIN和END,分别在程序开始前和结束前执行,相当于类的构造及析构函数。 awk的执行过程: 执行BEGIN语句,然后按行处理输入文本,最后执行END语句。
  2. 记录和域
    awk 认为纪录是结构化的,awk将输入文件按行处理,行中每个字符串定义为域,域中用分隔符分隔(通常以空格或, :等分隔),如:
lrwxr-xr-x     1 root         wheel      8 Jun 26  2016 bin
lrwxr-xr-x     1 root         wheel      8 Jun 26  2016 include

上面的输入有2行,每行有9个域
域在awk中用$N表示,其中N=1、2..., $0表示整条纪录

awk编程

  • awk 内置变量
    AWK的内建变量包括域变量,例如$1, $2, $3,以及$0。这些变量给出了记录中域的内容。 内建变量也包括一些其他变量:
- NR:已输入记录的条数。
- NF:当前记录中域的个数。记录中最后一个域可以以$NF的方式引用。
- FILENAME:当前输入文件的文件名。
- FS:“域分隔符”,用于将输入记录分割成域。其默认值为“空白字符”,即空格和制表符。FS可以替换为其它字符,从而改变域分隔符。
- RS:当前的“记录分隔符”。默认状态下,输入的每行都被作为一个记录,因此默认记录分隔符是换行符。
- OFS:“输出域分隔符”,即分隔print命令的参数的符号。其默认值为空格。
- ORS:“输出记录分隔符”,即每个print命令之间的符号。其默认值为换行符。
- OFMT:“输出数字格式”(Format for numeric output),其默认值为"%.6g"。
  • 函数 awk内置和很多函数,当然也可以自定义函数,示例如下:
awk '
function add_three (number) {
  return number + 3
}
BEGIN {result=add_three(1); print result}
'

上面的例子输出4.

  • awk脚本 可以使用awk脚本的方式来执行awk命令,awk脚本模版如下,与命令行方式类似:
  #! /bin/awk -f
  BEGIN{}
  {}
  END{}
  • 匹配
    可以使用
    awk 'BEGIN {FS=","} {if($1~/xxx/) print $2 >>data.txt}' filename 
    

    来提取匹配的域,其中xxx为匹配的正则表达式

    • 格式化 可以使用printf来代替print,输出格式化的文本。格式符和c语言类似,常用的为%d,%s,

    • 循环及条件语句 awk中的循环语句同样借鉴于C语言,支持while、do/while、for、break、continue,这些关键字的语义和C语言中的语义完全相同。

    条件语句为if/else,与C语言也相同

    awk中使用shell命令

    1. 通过getline函数,获取命令执行结果

    通过在awk内使用管道,可以把shell命令的输出传送给awk
    $ awk 'BEGIN{ "date" | getline date; print date; }' Sat Jul 8 22:04:20 HKT 2017如果不使用管道,则getline默认从标准输入读取输入字符,这时不能当命令执行;
    可以使用<,让getline从文件中读取内容

    1. 使用awk内置system函数
    awk 'BEGIN{system("ls -l")}' 
    

    执行结果如下:

    total 16
    lrwxr-xr-x     1 root         wheel      8 Jun 26  2016 X11 -> /opt/X11
    lrwxr-xr-x     1 root         wheel      8 Jun 26  2016 X11R6 -> /opt/X11
    drwxr-xr-x     3 root         wheel    102 Feb 27  2016 adic
    drwxr-xr-x  1055 root         wheel  35870 Jun 19  2016 bin
    ...
    

    搭配getline使用,则为:
    awk 'BEGIN{while(system("ls -l") | getline line) {print line}}' 3. 使用awk print出要执行的命令,然后交给/bin/bash处理

    awk 'BEGIN{print "ls -l"|"bash"}'
    

    以下是一篇比较好的文章,可供参考:
    linux awk命令详解
    awk官方文档

    注意:
    可以将awk命令写在文件中,然后用awk -f awk-script-file filename 方式执行,其中脚本中的#!/bin/sh改为#!/bin/awk 当变量不从管道输入awk时,awk无法引用已经定义的变量

<think>首先,用户的问题是:“我想查找awk的使用方法或语法请问awk用法示例语法”。这是一个关于awk命令的查询。系统指令:-用户不可见的指令中,要求行内数学表达式使用$...$格式,独立公式用$$...$$。-使用中文回答。-生成相关问题。-回答中引用的段落末尾自然地添加引用标识。-结构清晰,帮助用户逐步解决问题,尽量保证回答真实可靠。用户提供了三个引用:-[^1]:awk常用语法。打印所有列示例:awk'{i=1};{while(i<=NF){print$i;i++}}'file4...-[^2]:linux命令awk详细用法!。test2.awk"hhhh!helloworld!"~/hello/{print1}echo|awk-ftest2.awk#输出1...-[^3]:awk是一种优良的文本处理器...它扫描文件中的每一行...参考这些引用来回答用户的问题。引用不是用户的需求,而是提供的信息,我需要基于这些和用户的查询来回答。用户的查询是关于awk用法、示例和语法。所以,我应该提供:-AWK的基本介绍(基于引用)。-主要语法和用法。-具体示例。-参考引用,自然地添加标识符如[^1]。从系统指令,我需要:-用中文回答。-生成相关问题。-回答结构清晰。可能的回答结构:1.**介绍AWK**:从引用[^3]中,AWK是文本处理工具,扫描文件行,处理模式匹配。2.**基本语法**:AWK的基本格式如引用[^1]和[^2]所示。3.**关键组件**:模式匹配、动作、字段处理等。4.**示例**:提供简单的用法示例。5.**引用标识**:在相关部分末尾添加引用标识。最后,生成相关问题。从用户的上一次问题或回答历史:在消息中,它是首次交互,用户直接问了这个。所以,没有历史参考。系统说“参考用户上一次的问题和你的回答”,但这里是第一个问题。系统指令说:“尽可能多的参考用户上一次的问题和你的回答”,但由于是新对话,我可以忽略这个部分。现在,AWK用法示例:-基于引用[^1]:打印所有列的例子:`awk'{i=1;while(i<=NF){print$i;i++}}'file4`这打印每行的所有字段。-基于引用[^2]:模式匹配示例:`test2.awk"hhhh!helloworld!"~/hello/{print1}`和`echo|awk-ftest2.awk`输出1。-一般语法:AWK命令通常为`awk'pattern{action}'file`。我应该扩展内容:-**模式(Pattern)**:指定条件,如正则表达式或关系表达式。-**动作(Action)**:指定当模式匹配时执行的操作,如print或赋值。-**内置变量**:NF(NumberofFields)、NR(NumberofRecords)、$0(整个记录)、$1,$2,...(字段)。-**运算符**:如~(匹配),!~(不匹配),从引用[^2]。为结构清晰:1.**什么是AWK?**简要介绍。2.**基本语法结构**:解释格式。3.**常用用法和示例**:-打印特定字段。-模式匹配。-处理整行。4.**参考引用**:如[^3]用于介绍。生成相关问题:-相关于awk的高级用法、错误处理等。-例如:如何使用AWK处理CSV文件?AWK如何用于数据汇总?确保语言中文。回答开头:先介绍AWK。然后逐步解释。最后添加相关问题。</think> ### AWK 简介 AWK 是一种强大的文本处理工具和编程语言,常用于扫描文件的每一行、基于给定模式执行操作(如提取数据或进行计算)。它广泛应用于日志分析、数据转换和报表生成等场景[^3]。AWK 的语法基于“模式-动作”(pattern-action)结构:当输入行匹配指定模式时,执行对应的动作(如打印或修改行)。下面我将逐步介绍 AWK 的基本用法、语法和示例,内容参考了提供的引用信息,确保真实可靠。 ### 基本语法结构 AWK 命令的基本格式为: ```bash awk 'pattern { action }' input_file ``` - **模式 (pattern)**:指定过滤条件,可使用正则表达式(如 `/regex/`)、关系操作符(如 `~` 匹配、`!~` 不匹配)或布尔表达式。如果模式省略,动作将应用于每一行[^2]。 - **动作 (action)**:用大括号 `{}` 包裹的命令序列,如 `print`、赋值或循环语句。动作是可选的,如果没有动作,则默认打印匹配行。 - **内置变量**:常用于处理文本行: - `$0`:表示整个当前行。 - `$1, $2, ..., $n`:表示行中第 n 个字段(列)。 - `NF`:行中的字段数。 - `NR`:当前记录的行号。 AWK 命令可以直接在命令行中使用,或写在脚本文件中(如使用 `-f script.awk` 选项调用)[^3]。 ### 常见用法与示例 下面是一些常见 AWK 用法和实际示例,帮助您快速上手。示例基于引用中的信息,并根据通用用法进行了扩展。 #### 示例 1: 打印所有字段(列) AWK 能扫描文件并打印每行的所有字段。使用 `while` 循环遍历字段: ```bash awk '{ i=1; while (i <= NF) { print $i; i++ } }' file4 ``` - **解释**: - `{ i=1; ... }`:初始化计数器 `i`。 - `while (i <= NF)`:循环到行尾(`NF` 为字段数)。 - `print $i`:打印第 `i` 个字段。 - 例如,输入行 `sdb sdc sde`,输出为每个字段一行:`sdb`, `sdc`, `sde`。 - **参考**:此语法适用于简单字段处理[^1]。 #### 示例 2: 基于模式匹配执行动作 使用正则表达式(如 `/hello/`)匹配行,并执行动作: ```bash # 创建一个测试文件 test2.awk,内容为: # ~ /hello/ { print 1 } # 命令行测试: echo "hhhh! hello world!" | awk -f test2.awk # 输出: 1 ``` - **解释**: - `~ /hello/`:模式部分,检查行中是否包含 "hello"。 - `{ print 1 }`:动作部分,如果匹配,打印 1。 - 如果不匹配,无输出。运算符 `~` 表示匹配正则表达式,`!~` 表示不匹配[^2]。 - **变体**:直接在命令行使用:`awk '~/hello/ {print 1}'`,会检查输入流。 #### 示例 3: 字段处理和简单计算 提取特定字段或进行计算,如计算文件总行数或特定列的总和: ```bash # 打印文件的第一列 awk '{ print $1 }' input.txt # 计算文件行数 awk 'END { print NR }' input.txt # 计算第二列之和 awk '{ sum += $2 } END { print sum }' input.txt ``` - **解释**: - `{ print $1 }`:只打印每行第一列。 - `END { ... }`:特殊模式,在输入结束后执行。 - `sum += $2`:累加第2列的值。 - 示例输入:行 `1 10` 和 `2 20`,输出为 `30`。 #### 示例 4: 使用循环和条件语句 在动作中结合循环或条件,实现复杂逻辑: ```bash # 为每一行打印行号和有多个字段的行 awk '{ if (NF > 1) { print NR, $0 } else { print "Single field" } }' data.txt ``` - **解释**: - `if (NF > 1)`:条件语句检查字段数是否大于1。 - `print NR, $0`:打印行号和整行。 - `else ...`:否则打印消息。 ### 最佳实践和提示 - **处理文件**:直接在命令行运行 AWK(如 `awk '...' file.txt`),或写脚本调用(如 `awk -f script.awk`)。 - **注意事项**: - AWK 默认使用空格作为字段分隔符(可通过 `-F` 选项更改,如 `awk -F',' '{...}'` 用于 CSV)。 - 模式可以是固定字符串、正则表达式,或条件语句。 - **性能**:AWK 处理文本高效,但大文件时避免复杂循环以提升速度[^3]。 如果您需要更多帮助,请提供具体文件或需求(如“如何用 AWK 处理日志文件?”),我可以定制解答。 ### 相关问题 1. AWK 如何修改字段值或添加新字段? 2. AWK 在处理 CSV 文件时有哪些技巧? 3. AWK 如何与 sed 或 grep 命令结合使用? [^1]: AWK 的基本语法示例和字段遍历功能。 [^2]: AWK 的模式匹配和运算符详细说明。 [^3]: AWK 的扫描机制和处理逻辑介绍。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值