文本处理工具

一、grep

grep正则表达式的全称为(Global search Regular EXpression),是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep文本处理工具有grep和egrep两种,其中egrep是grep的扩展在使用命令时grep -E = egrep。

1.1 grep命令的使用格式

在这里插入图片描述一般情况下,grep命令工作在贪婪模式下,即趋于最大长度的匹配
grep命令常用参数如下:

参数含义
-i忽略大小写
-v反向过滤
-n显示过滤的行号

在这里插入图片描述在这里插入图片描述参数-i
在这里插入图片描述参数-v
在这里插入图片描述参数-n
在这里插入图片描述

1.2 grep命令中的字符匹配规则
匹配格式含义
^wang匹配以wang开头的行
wang$匹配以wang结尾的行
w…g匹配以w和g之间有三个任意字符的行
*匹配其前字符任意次
?匹配其前字符一次或零次
+匹配其前字符至少一次
{n}匹配其前字符n次
{m,n}匹配其前字符m-n次
{,n}匹配其前字符至多n次
{m,}匹配其前字符至少m次
(wang){2}匹配字符串wang至少两次

示例1:
在这里插入图片描述示例2:
在这里插入图片描述示例3:
在这里插入图片描述在这里插入图片描述

二、sed

sed(Stream Editor)成为数据流编辑器,它是一种行编辑器,逐行处理ASCII的纯文本,符合要求的行进行处理,不符合的则不予理睬。

2.1 命令格式

sed命令有两种格式:
sed 参数 命令 处理对象
sed 参数 处理对象 -f 处理规则文件
在这里插入图片描述示例:
在这里插入图片描述在这里插入图片描述

2.2 常用命令及参数

常用的命令:

命令含义
p显示符合条件的行
d删除符合条件的行
a在指定的行后添加新行
i在指定的行前添加新行
c替换指定的行
w将指定范围内的内容另存到指定的文件中
r将指定的文件内容添加到另一个文件中符合条件的行后面

sed中符合条件的地址(行)的表达方式:
1、起始行,结束行 表示从起始行到结束行
2、/正则表达式/ 固定格式
3、具体数字, 指定的行
常见的参数:
sed命令在默认情况下处理完成后会将模式空间中的内容显示出来

参数含义
-n静默模式,不显示模式空间中的内容
-e多条策略
-i将更改内容导入到文件中,更改原文件内容

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述sed中的字符替换类似于vim中的字符替换
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

三、awk

命令格式:
awk -F 分隔符 BEGIN{}{}END{} FILENAME
①其中不加参数-F时默认使用的分隔符为空格
②BEGIN以及END选项可以不加,只添加中间花括号中的操作即可
awk常用的固定参数

参数含义
NR行数
NE列数
FILENAME文件名称本身

示例1:打印文件的行数,逐行处理,每一行处理后行数加1
在这里插入图片描述示例2:以空格为分隔符显示文件的列数,下图中绿色框中包含一个空格其他行均无空格,此命令仍然为逐行处理,逐行显示每行包含多少列
在这里插入图片描述示例3:显示文件名称
在这里插入图片描述示例4:打印文件的行数
在这里插入图片描述awk命令中$1表示第一列,$2表示第二列以此类推,注意$0表示所有列
awk命令也可以在中间花括号执行动作之前根据条件做筛选,使用的格式为/正则表达式/,而且可以添加多个条件
awk命令可以筛选出哪一列的信息是什么不是什么
在这里插入图片描述在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值