awk的用法一

这篇文章详细介绍了awk命令在Linux环境中的使用,包括指定分隔符处理文本、按条件过滤内容、在行首行尾添加文本、设置变量以及实际应用案例。awk是一个强大的文本分析工具,能方便地对文件进行切分、处理和打印操作。

参考文章1http://blog.chinaunix.net/uid-23302288-id-3785105.html
参考文章2https://www.runoob.com/linux/linux-comm-awk.html
参考文章3https://blog.youkuaiyun.com/start_2013/article/details/109516934
awk用来处理文本,按行读取进行处理

一、指定分隔符分割文本

log.txt中的文本内容

2 this is a test
3 Do you like awk
This's a test
10 There are orange,apple,mongo

命令格式

awk -F
格式 awk -F[分隔符] '{动作}' 文件名

  1. 不指定分隔符的类型,默认是空格或者tab
    $0: 每行的所有字符串
    $1: 每行切分后的第1个字符串
    $2: 每行切分后的第2个字符串
    awk '{print $1,$2}' log.txt
    没有指定分隔符,使用空格或者tab,将每行的文本内容分开,打印每行、经过切分后的第一个和第二个字符串
    输出
    在这里插入图片描述
    awk -F, '{print $1,$2}' log.txt
  2. 使用单个分隔符,对文本进行切分,由于每行都没有,,原样输出文本内容
    在这里插入图片描述
  3. 使用多个分隔符空格和,对文本进行切分
    awk -F'[ ,]' '{print $1,$2}' log.txt
    在这里插入图片描述
    用两个分隔符-F '/|.json'.这里的分隔符是/json,两者用|分开

二、按条件过滤文本

  1. 过滤第一列大于2的行
    awk '$1>2' log.txt #命令
    在这里插入图片描述
  2. 过滤第一列大于2的行,输出该行的前两个字符串
    awk '$1>2 {print $1,$2}' log.txt
    在这里插入图片描述
  3. 同时满足两个条件。过滤第一列大于2并且第二列等于Do的行
    awk '$1>2 && $2=="D" {print $1,$2,$3}' log.txt
    在这里插入图片描述
  4. 按列数和行数处理
    在这里插入图片描述

三、在行首/行尾添加文本

摘自https://blog.youkuaiyun.com/start_2013/article/details/109516934
在前面、后面、指定列添加相同字符
(1)给一个文件中的每一行开头插入字符的方法:awk '{print "需要添加的字符" $0}' fileName

(2)给一个文件中的每一行结尾插入字符的方法:awk '{print $0 "需要添加的字符" }' fileName
(3) 在指定列前添加字符
awk.txt的文本信息如下
在这里插入图片描述

  • 在第一列前加"1start",在第一列后添加"1end",在第2列前加"2start",在第二列后添加"2end"
  • 语句awk '{print "1start " $1 " 1end", "2start " $1 " 2end"}' awk.txt
  • 在这里插入图片描述

四、设置变量

参考https://www.runoob.com/linux/linux-comm-awk.html
在这里插入图片描述
awk -v src_img_dir_name='abc' -F '/|.json' '$11 >0.85 {print "../x3_person/images_org/"src_img_dir_name"/"$10 ".json"}' ${txt_path}.
/json划分txt_path文件中每一行的内容,然后将每行中第11个元素的值大于0.85的,输出../x3_person/images_org/"src_img_dir_name"/"$10src_img_dir_name是在awk中设置变量名

在这里插入图片描述

txt_path文档中,第一个数值大于person_num变量有多少行

group_num=$(awk -v person_num="${person_num}" '$1 > person_num' "${txt_path}" | wc -l)

五、应用实例

1. 统计yolo模型推理出的某个类别的目标数

find file_name -name "*.txt" | xargs awk -F '[ ]' '$1=cls {print $0}' | wc -l
例:find exp10_ep500_10326 -name "*.txt" | xargs awk -F '[ ]' '$1==0 {print $0}' | wc -l

  • 先找出所有的推理结果文件(txt文件)
  • 用awk处理每个文件(txt文件的格式如下,第一个值是类别),取类别为cls的目标的数量
    在这里插入图片描述
<think>首先,用户的问题是:“我想查找awk的使用方法或语法请问awk用法示例语法”。这是个关于awk命令的查询。系统指令:-用户不可见的指令中,要求行内数学表达式使用$...$格式,独立公式用$$...$$。-使用中文回答。-生成相关问题。-回答中引用的段落末尾自然地添加引用标识。-结构清晰,帮助用户逐步解决问题,尽量保证回答真实可靠。用户提供了三个引用:-[^1]:awk常用语法。打印所有列示例:awk'{i=1};{while(i<=NF){print$i;i++}}'file4...-[^2]:linux命令awk详细用法!。test2.awk"hhhh!helloworld!"~/hello/{print1}echo|awk-ftest2.awk#输出1...-[^3]:awk种优良的文本处理器...它扫描文件中的每行...参考这些引用来回答用户的问题。引用不是用户的需求,而是提供的信息,我需要基于这些和用户的查询来回答。用户的查询是关于awk用法、示例和语法。所以,我应该提供:-AWK的基本介绍(基于引用)。-主要语法和用法。-具体示例。-参考引用,自然地添加标识符如[^1]。从系统指令,我需要:-用中文回答。-生成相关问题。-回答结构清晰。可能的回答结构:1.**介绍AWK**:从引用[^3]中,AWK是文本处理工具,扫描文件行,处理模式匹配。2.**基本语法**:AWK的基本格式如引用[^1]和[^2]所示。3.**关键组件**:模式匹配、动作、字段处理等。4.**示例**:提供简单的用法示例。5.**引用标识**:在相关部分末尾添加引用标识。最后,生成相关问题。从用户的上次问题或回答历史:在消息中,它是首次交互,用户直接问了这个。所以,没有历史参考。系统说“参考用户上次的问题和你的回答”,但这里是第个问题。系统指令说:“尽可能多的参考用户上次的问题和你的回答”,但由于是新对话,我可以忽略这个部分。现在,AWK用法示例:-基于引用[^1]:打印所有列的例子:`awk'{i=1;while(i<=NF){print$i;i++}}'file4`这打印每行的所有字段。-基于引用[^2]:模式匹配示例:`test2.awk"hhhh!helloworld!"~/hello/{print1}`和`echo|awk-ftest2.awk`输出1。-般语法:AWK命令通常为`awk'pattern{action}'file`。我应该扩展内容:-**模式(Pattern)**:指定条件,如正则表达式或关系表达式。-**动作(Action)**:指定当模式匹配时执行的操作,如print或赋值。-**内置变量**:NF(NumberofFields)、NR(NumberofRecords)、$0(整个记录)、$1,$2,...(字段)。-**运算符**:如~(匹配),!~(不匹配),从引用[^2]。为结构清晰:1.**什么是AWK?**简要介绍。2.**基本语法结构**:解释格式。3.**常用用法和示例**:-打印特定字段。-模式匹配。-处理整行。4.**参考引用**:如[^3]用于介绍。生成相关问题:-相关于awk的高级用法、错误处理等。-例如:如何使用AWK处理CSV文件?AWK如何用于数据汇总?确保语言中文。回答开头:先介绍AWK。然后逐步解释。最后添加相关问题。</think> ### AWK 简介 AWK种强大的文本处理工具和编程语言,常用于扫描文件的每行、基于给定模式执行操作(如提取数据或进行计算)。它广泛应用于日志分析、数据转换和报表生成等场景[^3]。AWK 的语法基于“模式-动作”(pattern-action)结构:当输入行匹配指定模式时,执行对应的动作(如打印或修改行)。下面我将逐步介绍 AWK 的基本用法、语法和示例,内容参考了提供的引用信息,确保真实可靠。 ### 基本语法结构 AWK 命令的基本格式为: ```bash awk 'pattern { action }' input_file ``` - **模式 (pattern)**:指定过滤条件,可使用正则表达式(如 `/regex/`)、关系操作符(如 `~` 匹配、`!~` 不匹配)或布尔表达式。如果模式省略,动作将应用于每行[^2]。 - **动作 (action)**:用大括号 `{}` 包裹的命令序列,如 `print`、赋值或循环语句。动作是可选的,如果没有动作,则默认打印匹配行。 - **内置变量**:常用于处理文本行: - `$0`:表示整个当前行。 - `$1, $2, ..., $n`:表示行中第 n 个字段(列)。 - `NF`:行中的字段数。 - `NR`:当前记录的行号。 AWK 命令可以直接在命令行中使用,或写在脚本文件中(如使用 `-f script.awk` 选项调用)[^3]。 ### 常见用法与示例 下面是些常见 AWK 用法和实际示例,帮助您快速上手。示例基于引用中的信息,并根据通用用法进行了扩展。 #### 示例 1: 打印所有字段(列) AWK 能扫描文件并打印每行的所有字段。使用 `while` 循环遍历字段: ```bash awk '{ i=1; while (i <= NF) { print $i; i++ } }' file4 ``` - **解释**: - `{ i=1; ... }`:初始化计数器 `i`。 - `while (i <= NF)`:循环到行尾(`NF` 为字段数)。 - `print $i`:打印第 `i` 个字段。 - 例如,输入行 `sdb sdc sde`,输出为每个字段行:`sdb`, `sdc`, `sde`。 - **参考**:此语法适用于简单字段处理[^1]。 #### 示例 2: 基于模式匹配执行动作 使用正则表达式(如 `/hello/`)匹配行,并执行动作: ```bash # 创建个测试文件 test2.awk,内容为: # ~ /hello/ { print 1 } # 命令行测试: echo "hhhh! hello world!" | awk -f test2.awk # 输出: 1 ``` - **解释**: - `~ /hello/`:模式部分,检查行中是否包含 "hello"。 - `{ print 1 }`:动作部分,如果匹配,打印 1。 - 如果不匹配,无输出。运算符 `~` 表示匹配正则表达式,`!~` 表示不匹配[^2]。 - **变体**:直接在命令行使用:`awk '~/hello/ {print 1}'`,会检查输入流。 #### 示例 3: 字段处理和简单计算 提取特定字段或进行计算,如计算文件总行数或特定列的总和: ```bash # 打印文件的第awk '{ print $1 }' input.txt # 计算文件行数 awk 'END { print NR }' input.txt # 计算第二列之和 awk '{ sum += $2 } END { print sum }' input.txt ``` - **解释**: - `{ print $1 }`:只打印每行第列。 - `END { ... }`:特殊模式,在输入结束后执行。 - `sum += $2`:累加第2列的值。 - 示例输入:行 `1 10` 和 `2 20`,输出为 `30`。 #### 示例 4: 使用循环和条件语句 在动作中结合循环或条件,实现复杂逻辑: ```bash # 为每行打印行号和有多个字段的行 awk '{ if (NF > 1) { print NR, $0 } else { print "Single field" } }' data.txt ``` - **解释**: - `if (NF > 1)`:条件语句检查字段数是否大于1。 - `print NR, $0`:打印行号和整行。 - `else ...`:否则打印消息。 ### 最佳实践和提示 - **处理文件**:直接在命令行运行 AWK(如 `awk '...' file.txt`),或写脚本调用(如 `awk -f script.awk`)。 - **注意事项**: - AWK 默认使用空格作为字段分隔符(可通过 `-F` 选项更改,如 `awk -F',' '{...}'` 用于 CSV)。 - 模式可以是固定字符串、正则表达式,或条件语句。 - **性能**:AWK 处理文本高效,但大文件时避免复杂循环以提升速度[^3]。 如果您需要更多帮助,请提供具体文件或需求(如“如何用 AWK 处理日志文件?”),我可以定制解答。 ### 相关问题 1. AWK 如何修改字段值或添加新字段? 2. AWK 在处理 CSV 文件时有哪些技巧? 3. AWK 如何与 sed 或 grep 命令结合使用? [^1]: AWK 的基本语法示例和字段遍历功能。 [^2]: AWK 的模式匹配和运算符详细说明。 [^3]: AWK 的扫描机制和处理逻辑介绍。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值