正则表达式，sed简单用法

最新推荐文章于 2025-01-11 21:53:41 发布

转载最新推荐文章于 2025-01-11 21:53:41 发布 · 256 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/regit/p/8484888.html

文章标签：

#数据库

本文介绍常用的正则表达式字符及扩展用法，并通过实例演示sed的基础操作与复杂文本处理技巧，包括多点编辑、直接文件修改及IP地址提取。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一. 正则表达式

1. 常见的正则表达式字符

[]     匹配字符集   grep "bl[lo]g" oldboy.txt   表示字符‘l’或者‘o’都可匹配
 *     重复前面字符任意次  grep "bl*g" oldboy.txt    
.*     表示任意多个字符
[^]    表示非       grep "【^oldboy】" oldboy.txt 匹配文档中不是“oldboy”当中的任意字符
a{n,m}    重复字符a   最少n次，最多m次   
a{,m}        重复字符a   最少0次，最多m次    #有些版本这个不支持了
a{n,}        重复字符a   最少n次
a{n}         重复字符a   n次

注意：

实际使用中要在大括号前加转义字符 \ 例如：grep "490\{2,3\}328" oldboy.txt 如果用egrep不用加转义字符 \

2. 扩展的正则表达式：grep -E或者egrep

a+ ： 重复字符a     一次以上      grep -E "490+480" oldboy.txt; 等价于a{1,}
 
a? ：  重复字符a      0次或者1次  等价于a{,1}或者a{0,1}
 
|   ：用或的方式查找多个符合条件的字符    注意这里的符号“|” 前后不能有空格，个人理解等价于[]

() ： 小括号内表示把多个字符当做一组进行查找，相当于一个字符

例子1. 　

例子2

二. sed常见用法

常用选项：

-n：取消默认输出，只有经过sed特殊处理的那一行（或者动作）才会被列出来

-e：进行多项编辑，即对输入行应用多条sed命令时使用

-f：指定sed脚本的文件名，直接将sed的动作写在一个档案内，-f filename可以执行filename内的sed动作

-r：可支持扩展正则表达式

-i：直接修改读取的文件内容，而不是由屏幕输出

插入

sed -i '1 i oldboy' aa.txt

sed -i:表示直接编辑修改读取的文件内容 1：表示在第一行插入 i：表示插入 oldboy是插入内容

多点编辑（sed -e）

sed -e '1,10d' -e 's/My/Your/g' datafile

直接编辑文件内容（sed -i)

如果只用-e只是把输出的内容做了更改，并不会修改文件中的内容，要修改必须加-i 参数

例如：

sed -i -e '2 i character_set_server=uft8' -e '3 i binlog_format=row' /etc/my.cnf

优化1：消除空格，使用i是在目前的上一行插入数据
sed -i -e '2 i character_set_server=uft8' -e '2 i binlog_format=row' /etc/my.cnf  说明sed是从前到后按命令分步执行的。

优化2：消除空格，使用a是在目前的下一行插入数据，这个使用了转义字符\n来换行，这样就不用多点编辑选项-e了
sed -ir "/[mysqld]/ a character_set_server=utf8 \nbinlog_format=row" /etc/mysql/my.cnf

sed链接地址 http://www.cnblogs.com/emanlee/archive/2013/09/07/3307642.html

三. sed实战

以网卡eth0的输出信息为例，取出10.0.0.7这个IP地址

1. sed过滤第二行

 ifconfig eth0 |sed -n '/inet addr/p' 
 或者                                                                                                                   
 ifconfig eth0 | sed -n '2p'

特别要注意后面的p必须在单引号内，p就是输出的意思，n是取消默认输出。输出信息为

2. 用sed的参数sg进行全局替换，格式为sed 's###g'

s#ddd#kkk#g 就是把ddd替换为kkk,如果不写kkk那就是替换为空，要想取出10.0.0.7,需要把它前面和后面的字符都替换为空

1）替换10.0.0.7前面的字符，口诀就是以什么开头，以挨着目标前面的字符结尾

一般是以任意字符开头 ^.* 以addr:结尾，这个例子中也可写成以r:结尾，因为这里r:也是唯一的。写到命令中就是 sed 's#^.*addr:##g' （其实也可以不要^字符）

2）然后，干掉后面的字符，

需要再来一个替换，严格上来讲，要以2个空格Bc开头，任意字符结尾，这里直接用Bc开头也行，sed 's# Bc.*$##g' （这里末尾可不用$）

3. 用sed完全匹配ip地址，用（）限定ip地址组，它的作用是相当于一个字符

ifconfig eth0 | sed -rn 's#^.*inet addr:(.*)  Bcast.*$#\1#gp'

说明：

1. -r（regexp-extended），sed -nr 这样小括号前就不需要用转义字符了

2. sed中\1表示命令中的从左边数第一个小括号（）的输出内容，同理 \2 表示第2个小括号内容，当然这里只有1个小括号，就不存在\2的情况了

3. ( ) 在替换命令中是“组”的用法（正则表达式中也是这样），后面可以用\1 \2 等来分别引用前面括起来的部分。

4. 补充例子

我利用该指令的格式为：sed 's#old#new#g' file 但是利用该格式并不能实现完全匹配替换。例如我要替换文本中的“the”字符串，但是文本内的“other”中间部分也被替换了。如何解决？

sed 's#\<old\>#new#g' file

这个是匹配单词一样的东西

意思就是限制它的宽度去掉左右两边之一的那个“>" 符号就相当于放宽那边不限制

转载于:https://www.cnblogs.com/regit/p/8484888.html