Linux 练习 - 文本处理三剑客之AWK

最新推荐文章于 2025-06-23 07:00:00 发布

原创

最新推荐文章于 2025-06-23 07:00:00 发布 · 584 阅读

2 ·

CC 4.0 BY-SA版权

本文通过8个实例介绍了如何利用AWK在Linux环境中处理文本数据，包括提取主机名、统计文件系统类型、单词出现次数、提取数字、找出整数范围、DOS攻击防护、FQDN计数排序以及按inode聚合数据。

1、文件 ip_list.txt 如下格式，请提取 ”.solin.com” 前面的主机名部分并写入到回到该文件中

1 blog.solin.com

2 www.solin.com

…

999 study.solin.com

[root@centos7 ~]# awk -F "[ .]" '{print $2}' ip_list.txt >> ip_list.txt

2、统计 /etc/fstab 文件中每个文件系统类型出现的次数

[root@centos7 ~]# awk '/^UUID/{fs[$3]++}END{for(i in fs){print i,fs[i]}}' /etc/fstab
swap 1
xfs 2

3、统计 /etc/fstab 文件中每个单词出现的次数

[root@centos7 ~]# awk -F "[)( /=',-]" '{for(i=1;i<=NF;i++){if($i ~ "\\<[[:alpha:]]+\\>"){word[$i]++}}}END{for(i in word){print word[i],i}}' /etc/fstab  | sort -nr

或 

[root@centos7 ~]# awk -F "[)( /=',-]" '{for(i=1;i<=NF;i++){if($i ~ "\\y[[:alpha:]]+\\y"){word[$i]++}}}END{for(i in word){print word[i],i}}' /etc/fstab  | sort -nr

4、提取出字符串 Yd$C@M05MB%9&Bdh7dq+YVixp3vpw 中的所有数字

[root@centos7 ~]# echo "Yd$C@M05MB%9&Bdh7dq+YVixp3vpw" | awk '{gsub(/[^0-9]/,"",$0);print $0}'
05973

5、有一文件记录了 1-100000 之间随机的整数共 5000 个，存储的格式 100,50,35,89… 请取出其中最大和最小的整数

[root@centos7 ~

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

东方隐

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

第五章 文本处理工具和正则表达式 -- 文本处理三剑客之 awk（五）

Raymond的博客

04-08

302

摘要：本文介绍了awk编程中next语句和数组的使用方法。next语句可以提前结束当前行处理进入下一行。awk数组为关联数组，可自动创建元素并初始化为空串，通过"index in array"判断元素存在性，使用for循环遍历数组。范例包括：利用数组去重、统计TCP连接状态次数、分析访问日志IP频率以及多维数组操作。重点展示了如何利用数组实现高效数据处理，如状态统计、IP封禁等实用功能。

文本三剑客------awk 文本处理语言

weixin_45697293的博客

11-19

757

文章目录awk简介awk工作原理print格式awk变量1.内置变量2. 自定义变量printf命令操作符常用的action分类awk控制语句1.if--else语法：2.while循环3.do-while循环4.for循环5.switch语句6.break和continue性能比较 awk简介 awk：报告生成器，格式化文本输出版本：New awk（nawk），GNU awk（ gawk） gawk：模式扫描和处理语言基本用法： awk [options] ‘program’ var=value fi

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

weixin_46797804 2021.10.19
最后一题if(min[$1]>$2 || !min[$1]){min[$1]=$2};if(max[$1]<$3 || !max[$1]){max[$1]=$3}} \是什么意思啊？

企业shell面试题：利用Linux三剑客解答企业面试题实战

weixin_34343000的博客

10-10

794

Linux三剑客企业级经典面试题解答实战说明：来自早晨老男孩教育在线班一期同学的面试题和学生给出的答案整理面试题：请过滤oldboy.log中在device: {}里面出现了多少次oldboy，过滤并统计出来。oldboy is a linuxer.device: {oooldboyno sqlthis is logniu niu}oldboydevice: {oldboyno sqlthis ...

Linux文本三剑客grep练习

weixin_72583321的博客

12-15

1415

1、显示/etc/rc.d/rc.sysinit文件中以不区分大小的h开头的行； 2、显示/etc/passwd中以sh结尾的行; 3、显示/etc/fstab中以#开头，且后面跟一个或多个空白字符，而后又跟了任意非空白字符的行； 4、查找/etc/rc.d/rc.local中包含“以to开始并以to结尾”的字串行； 5、查找/etc/inittab中含有“以s开头，并以d结尾的单词”模式的行； 6、查找ifconfig命令结果中的1-255之间的整数；

linux中文本处理三剑客

微生活Pro

08-07

2425

正则表达式（Regular Expression，）：元字符： . 任意单个字符表示字符个数的元字符： * 匹配其前面的字符任意次如：a*b 则b，ab aab aaab都可以但acb不可以 .* 任意长度的任意字符 \？匹配其前面的字符1次或0次 \{m,n\}:匹配其前面的字符至少m次，至多n次位置锚定： ^:锚定行首，此字符后面的任意内容必须出现在行首 $:锚定行尾，此字符...

Linux 练习 - 文本处理三剑客之SED

东方隐

05-29

308

1、删除 centos7 系统 /etc/grub2.cfg 文件中所有以空白开头的行行首的空白字符； [root@centos7 ~]# sed -ri 's/^[ ]+(.*)$/\1/' /etc/grub2.cfg 或 [root@centos7 ~]# sed -ri.bak 's/^[ ]+(.*)$/\1/' /etc/grub2.cfg 2、删除 /etc/fstab 文件中所有以#开头，后面至少跟一个空白字符的行的行首的 # 和空白字符； [root@localhost ~]# sed

Linux学习系列 --awk命令学习

ydm东方旭日的专栏

08-10

620

关于awk命令一直想学一篇文章，无意中发现awk命令学习这篇文章总结的很好，于是转载至此。 awk简介 awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言： AWK 程序设计语言，三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序，这些程序读取输...

文本处理三剑客grep、sed、awk

哭的博客

09-16

874

处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”，接着用。awk 处理的工作方式与数据库类似，支持对记录和字段处理，这也是 grep 和 sed 不能实现的。sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容发送往屏幕。然后读入下行，执行下一个循环。在 awk 中，缺省的情况下将文本文件中的一行视为一个记录，逐行放到内存中处理，而将一行中的。pattern1，pattern2 范围模式，匹配所有模式1的记录，直到匹配到模式2。$后跟数字，引用对应的字段，以逗号分隔，0 表示整个行。

Linux三剑客之awk 命令使用教程

weixin_45668002的博客

05-26

585

若分隔符为制表符（\tawk -F'\t' '{print $1}' 文件.txtawk命令凭借其简洁的语法和强大的数据处理能力，成为文本分析、日志处理、数据清洗等场景的必备工具。通过灵活组合模式匹配字段操作和逻辑计算，可高效解决各类数据处理需求。建议通过实际案例反复练习，逐步掌握其进阶用法（如数组、函数定义等），进一步提升工作效率。

Linux文本处理三剑客实战指南：grep、sed、awk

最新发布

平凡的梦

06-23

1436

Linux三剑客实战指南：grep、sed、awk核心解析本文详解Linux文本处理三剑客grep、sed、awk的核心功能与实战应用： grep：专注文本搜索，支持正则表达式匹配，常用参数包括-i（忽略大小写）、-v（反向匹配）、-n（显示行号）等 sed：擅长流编辑，实现文本替换（s命令）、删除（d命令）、插入（i/a命令）等批量操作 awk：提供完整编程能力，支持字段分割、条件判断、数组统计和格式化输出通过典型场景对比和实战案例（日志分析、批量替换、数据统计等），帮助读者掌握三大工具的核心差异与组

Linux三剑客

令狐_JackieHao的博客

04-29

1900

Linux三剑客 文章目录Linux三剑客一、正则表达式1.2**正则表达意义**：二、Linux三剑客grep2.1、grep练习2.2、找出所有以m开头的行2.3、输出所有以m开头的行2.4输出所有以i开头的行2.5找出所有允许登录的用户，解释器是/bin/bash的行三、sed与正则表达式3.1、输出文件第二行、第三行3.2、过滤出含有“Linux”字样的文本3.3、删除含有game的行3.4、全局替换，将my换成i四、sed配合正则表达式企业案例4.1、取出linux的ip地址【去头去尾】五、Lin

脚本作业

passionboyxie的专栏

09-25

1273

Steve Blenheim:238-923-7366:95 Latham Lane, Easton, PA 83755:11/12/56:20300 Betty Boop:245-836-8357:635 Cutesy Lane, Hollywood, CA 91464:6/

关于Linux文本处理“三剑客”的一些小操作。

FQ992537288的博客

08-19

164

Linux文本处理“三剑客”,即grep、sed、awk，这是Linux中最核心的3个命令。一、首先做个简单的介绍： 1、awk:linux三剑客老大，过滤，输出内容，一门语言。NR代表行号。 2、sed: linux三剑客老二，流编辑器，实现对文件的增删改查替换；参数 -n 取消默认输出 3、grep:linux三剑客老三，过滤所需要...

Linux：三剑客之一 sed 的练习一

zJay-L's Blog

08-04

247

sed 流编辑器（非交互式编辑器） stream editor (如果在使用sed的过程中发现’‘内的符号或者其他有冲突，可以尝试把’'换成"") 工作模式：逐行处理语法： sed [选项] ‘行的定位动作’ 文件… 选项： -n：静默输出,关闭模式空间的输出,不会输出未匹配到的行一般与p命令结合使用 -e：允许进行多项编辑,也就是说对同一行做多次处理、. 可以做多点编辑 -e ‘动作1’ -e ‘动作2’ == ‘动作1;动作2’ -f：后接sed脚本,指定执行的s

有关linux三剑客之sed的一道练习题

weixin_34259559的博客

08-27

300

1.1 取出a.txt中的908这三个数字：实例：[root@zhengjincheng tmp]# cat a.txt aaaaaaaaaaaaabbbb bbbbbbbbbbbbbbi am zjc 1046(88)908 jiayou[root@zhengjincheng tmp]#结果是：[root@zhengjincheng tmp]# cat a.txt aaaa...

L29.linux命令每日一练 -- 第四章 文本处理三剑客 -- sed命令

Raymond的博客

07-17

420

【命令星级】 ★★★★★ 【功能说明】 sed是Stream Editor（字符流编辑器）的缩写，简称流编辑器。它是Linux三剑客之一。 sed是操作、过滤和转换文本内容的强大工具。sed的常用功能包含对文件实现快速增删改查（增加、删除、修改、查询），其中查询的功能中最常用的两大功能是过滤（过滤指定字符串）和取行（取出指定的行）。【语法格式】说明： 1）为了避免混淆，本文称呼sed为sed或sed命令，将实现不同sed功能的内部命令参数，称为“sed内置命令字符”，以区

linux三剑客

2302_79253478的博客

05-07

833

本文暂时整理linux中正则表达式、三剑客的基础知识。后续训练内容会不定期更新。

Linux文本处理三剑客（详解）

2301_77475090的博客

05-22

3902

使用正则表达式搜索文本匹配到的文本会显示出来并标红使用权限是所有用户sed命令是将一系列的编辑命令应用于批处理文本的理想工具。sed命令拥有非交互式和高效的特点，可以为用户节约大量的时间。本节将介绍sed命令的基础知识。sed命令是一个非交互式的文本编辑器，它可以对来自文本文件以及标准输出的行进行编辑。其中，标准输出可以是来自键盘、文件重定向、字符串、变量或者是管道的文本。

linux shell学习--awk练习

weixin_30564785的博客

05-07

167

例子文件素材样式： 120.197.87.216 - - [04/Jan/2012:00:00:02 +0800] "GET /home.php?mod=space&uid=563413&mobile=yes HTTP/1.1" 200 3388 "-" "-"123.126.50.73 - - [04/Jan/2012:00:00:02 +0800] "GET /th...

Linux文本三剑客awk练习

04-03

嗯，用户想学习或练习Linux下的awk用法，需要提供示例和教程。首先，我得回忆一下awk的基本概念和工作原理。记得awk是一种文本处理工具，逐行处理数据，按字段进行操作。用户可能需要从基础开始，逐步深入。然后，...