一. 正则表达式
1. 常见的正则表达式字符
[] 匹配字符集 grep "bl[lo]g" oldboy.txt 表示字符‘l’或者‘o’都可匹配 * 重复前面字符任意次 grep "bl*g" oldboy.txt .* 表示任意多个字符 [^] 表示非 grep "【^oldboy】" oldboy.txt 匹配文档中不是“oldboy”当中的任意字符 a{n,m} 重复字符a 最少n次,最多m次 a{,m} 重复字符a 最少0次,最多m次 #有些版本这个不支持了 a{n,} 重复字符a 最少n次 a{n} 重复字符a n次
2. 扩展的正则表达式:grep -E或者egrep
a+ : 重复字符a 一次以上 grep -E "490+480" oldboy.txt; 等价于a{1,} a? : 重复字符a 0次或者1次 等价于a{,1}或者a{0,1} | :用或的方式查找多个符合条件的字符 注意这里的符号“|” 前后不能有空格,个人理解等价于[] () : 小括号内表示把多个字符当做一组进行查找,相当于一个字符
例子1.


二. sed常见用法
常用选项:
-n:取消默认输出,只有经过sed特殊处理的那一行(或者动作)才会被列出来
-e:进行多项编辑,即对输入行应用多条sed命令时使用
-f:指定sed脚本的文件名,直接将sed的动作写在一个档案内,-f filename可以执行filename内的sed动作
-r:可支持扩展正则表达式
-i:直接修改读取的文件内容,而不是由屏幕输出
插入
sed -i '1 i oldboy' aa.txt
多点编辑 (sed -e)
sed -e '1,10d' -e 's/My/Your/g' datafile
直接编辑文件内容 (sed -i)
sed -i -e '2 i character_set_server=uft8' -e '3 i binlog_format=row' /etc/my.cnf
优化1:消除空格,使用i是在目前的上一行插入数据 sed -i -e '2 i character_set_server=uft8' -e '2 i binlog_format=row' /etc/my.cnf 说明sed是从前到后按命令分步执行的。
优化2:消除空格,使用a是在目前的下一行插入数据,这个使用了转义字符\n来换行,这样就不用多点编辑选项-e了
sed -ir "/[mysqld]/ a character_set_server=utf8 \nbinlog_format=row" /etc/mysql/my.cnf
三. sed实战
以网卡eth0的输出信息为例,取出10.0.0.7这个IP地址
1. sed过滤第二行
ifconfig eth0 |sed -n '/inet addr/p'
或者 ifconfig eth0 | sed -n '2p'
特别要注意后面的p必须在单引号内,p就是输出的意思,n是取消默认输出。输出信息为
2. 用sed的参数sg进行全局替换,格式为sed 's###g'
1)替换10.0.0.7前面的字符,口诀就是以什么开头,以挨着目标前面的字符结尾

2)然后,干掉后面的字符,
需要再来一个替换,严格上来讲,要以2个空格Bc开头,任意字符结尾,这里直接用Bc开头也行,sed 's# Bc.*$##g' (这里末尾可不用$)
3. 用sed完全匹配ip地址,用()限定ip地址组,它的作用是相当于一个字符
ifconfig eth0 | sed -rn 's#^.*inet addr:(.*) Bcast.*$#\1#gp'
说明:
1. -r(regexp-extended),sed -nr 这样小括号前就不需要用转义字符了
2. sed中\1表示命令中的从左边数第一个小括号()的输出内容,同理 \2 表示第2个小括号内容,当然这里只有1个小括号,就不存在\2的情况了