让文本飞

grep常见用法

grep "match text" filename1 filename2 --color=auto  行匹配

grep -v "not match text" filename 行匹配取反

egrep -o "match text" filename 特殊字符提取

grep -c "match text" filename 匹配字符的行数,不是次数

grep -n "wei" filename 打印出行数

grep -l  "match text" filename ... 搜索多个文件并找出匹配文本所在文件。-L返回不匹配文件列表

忽略大小写 -i

递归搜索文件 ,在多级目录对文本递归搜索 -r or -R

匹配多个样式

grep -e "patern 1" -e "patern2"

grep -f patternfile

制定或排除目标搜索文件

grep "pattern" . -r --include *.{py,conf}

grep "pattern" . -r --exclude *.{log,pyc}

静默输出

grep -q "match text" filename1,如果有匹配项返回0,如果没有匹配项返回非0

 

匹配特定格式字符

一段日志

193548_oGs4_81653.png

如果我要提取出所有的service

193352_y65D_81653.png

去掉模式前面的部分,用(?<=xxx),如果是模式后面的部分,用(?=xxx),其中xxx就是你不想要的那些内容

echo "addr:10.150.151.218"|grep -oP "(?<=addr:)[0-9\.]+" 
10.150.151.218

echo 'cooking singing' | grep -oP "[a-z]*(?=ing)"
cook

echo 'abcdefgabcdefg abcwhatsyour' | grep -oP '(?<=abc)[a-z]+'
defgabcdefg
whatsyour

echo 'abcdefgabcdyour abcwhatsyour' | grep -oP '[a-z]+(?=your)'             
abcdefgabcd
abcwhats

194339_wO4g_81653.png

 

101.251.2.81 - - [04/Aug/2016:15:00:18 +0800] "d.nuomi.com GET /apple-app-site-association HTTP/1.1" 200 105 "-" "-" "swcd (unknown version) CFNetwork/711.2.23 Darwin/14.0.0" 1470294018.078 0018078561 10.208.151.48 10.202.51.42:8633 200 d.nuomi.com "101.251.2.81, 101.251.2.81" - - 00180785610815255562080415 0.014 0.014
tail access.log|grep -oP "(?<=\")[a-z].nuomi.com"
i.nuomi.com
i.nuomi.com
m.nuomi.com
i.nuomi.com
d.nuomi.com
i.nuomi.com
d.nuomi.com
i.nuomi.com
d.nuomi.com
i.nuomi.com

cut

按照列进行文件切分

cut -f field_list_no1,field_list_no2 -d"字段定界符" filename

要打印哪些列,有如下定义规则

-f 2,4 第二列和第四列

-f 2 --complement 除第二列之外

-f 2-  第二列到末尾

-f -2 开始到第二列

-f 2-4 第二列到第四列

cut实现的功能也可用awk实现

sed

what & when

Icon

sed:流编辑器,用程序的方式来编辑文本。

当需要按行处理文本数据时,使用sed会非常方便,一个命令就能搞定(python还需要open,然后来个循环呢....

 

tips:默认情况下,sed的处理结果只会打印出来,不会修改原文件。如果需要修改源文件,使用-i参数。

用s命令替换

Icon

替换命令的基本格式如下:

sed "[行号]s/正则表达式/待替换数据/[序号&g]" filename

注释:[行号]和[序号&g]是可以不写的。下表列出写&不写的区别。

condition

result

都不写替换所有匹配行的第一个match结果
有[行号],无[序号&g]替换命中行的第一个match结果
无[行号],有[g]替换所有匹配行的所有match结果
无[行号],有[序号]替换所有匹配行的序号match结果
有[行号],有[g]替换命中行的所有match结果
有[行号],有[序号]替换命中行的序号match结果
-,有[序号&g]替换命中行中序号以后所有的match结果

举例:将3~6行中所有的my替换成your =》sed "3,6s/my/your/g" test.txt

 

tips 1:行号/序号中,第一行/个用1标识,最后一行/个用$标识。

tips 2:一次替换多个模式的情况,将多个模式用分号隔开。sed "1,3s/my/your/g;4,$s/my/her/g" test.txt

tips 3:可以更改替换符。如:sed "3,6s:/home/work:/home/hailian:g" test.txt

 

其他命令(a&i&c&d&p)

Icon

a命令:在匹配行后append(追加)一行数据

sed "1 a hello hailian" test.txt =>在第一行后追加行hello hailian

i命令:在匹配行前insert(插入)一行数据

sed "1 i hello hailian" test.txt =>在第一行前插入行hello hailian

c命令:替换匹配行

sed "/my/c hello hailian" test.txt=>将匹配my的所有行均替换为hello hailian

d命令:删除匹配行

sed "/my/d" test.txt =>删除匹配my的所有行

p命令:打印匹配行

sed -n "/my/p" test.txt =>打印匹配my的所有行

 

tips 1:匹配行,可以通过正则匹配,也可以通过行号匹配;

tips 2:p命令打印时如果不加-n 匹配行会打印两次;

sed命令行格式为:

         sed [-nefri]  ‘command’  输入文本/文件

常用选项:

        -n∶取消默认的输出,使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN的资料一般都会被列出到屏幕上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来

        -e∶进行多项编辑,即对输入行应用多条sed命令时使用. 直接在指令列模式上进行 sed 的动作编辑

        -f∶指定sed脚本的文件名. 直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内的sed 动作

        -r∶sed 的动作支援的是延伸型正则表达式的语法。(预设是基础正则表达式语法)

        -i∶直接修改读取的文件内容,而不是由屏幕输出

 

常用命令:

        a ∶ 新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)

        c ∶ 取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行

        d ∶ 删除,因为是删除,所以 d 后面通常不接任何内容

         i ∶ 插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行)

         p∶ 列印,亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起用

         s∶ 取代,可以直接进行替换的工作。通常这个 s 的动作可以搭配正则表达式。例如 1,20s/old/new/g

 

只打印第三行

[wangweiwei11@cp01-rdqa-dev392.cp01 temp]$ sed -n '3p' host.txt

nj03-orp-app1462.nj03

 

查看10-15行

[wangweiwei11@cp01-rdqa-dev392.cp01 temp]$ sed -n '10,15p' host.txt

st01-orp-app0531.st01

m1-orp-app0901.m1

nj02-orp-app1246.nj02

nj03-orp-app1402.nj03

nj02-orp-app0170.nj02

cq02-orp-app0762.cq02

 

地址是逗号分隔的,那么需要处理的地址是这两行之间的范围(包括这两行在内)

sed '2,5d' datafile

#删除第二到第五行

sed '/My/,/You/d' datafile

#删除包含"My"的行到包含"You"的行之间的行

sed '/My/,10d' datafile

#删除包含"My"的行到第十行的内容

注意: 使用 sed 的d 指令,你可以删除一些行。请注意这些行只是在输出的时候被删除。和其他命令一样,d命令不会修改源文件的内容。

 

 

删除某行

     [root@localhost ruby] # sed '1d' ab              #删除第一行

     [root@localhost ruby] # sed '$d' ab              #删除最后一行

     [root@localhost ruby] # sed '1,2d' ab           #删除第一行到第二行

     [root@localhost ruby] # sed '2,$d' ab           #删除第二行到最后一行

  显示某行

.    [root@localhost ruby] # sed -n '1p' ab           #显示第一行

     [root@localhost ruby] # sed -n '$p' ab           #显示最后一行

     [root@localhost ruby] # sed -n '1,2p' ab        #显示第一行到第二行

     [root@localhost ruby] # sed -n '2,$p' ab        #显示第二行到最后一行

  使用模式进行查询

     [root@localhost ruby] # sed -n '/ruby/p' ab    #查询包括关键字ruby所在所有行

     [root@localhost ruby] # sed -n '/\$/p' ab        #查询包括关键字$所在所有行,使用反斜线\屏蔽特殊含

 

添加行

[wangweiwei11@cp01-rdqa-dev392.cp01 temp]$ sed '1,3a wangweiweiloveyanyan' sed.txt

 [root@localhost ruby] # sed '1a drink tea\nor coffee' ab   #第一行后增加多行,使用换行符\n

 

替换

   [root@localhost ruby] # sed '1c Hi' ab                #第一行代替为Hi
     Hi
     ruby is me,welcome to my blog.
     end
     [root@localhost ruby] # sed '1,2c Hi' ab             #第一行到第二行代替为Hi

     Hi

     end

 

 

替换一行中的某一个部分

sed 's/要替换的字符串/新的字符串/g'

[wangweiwei11@cp01-rdqa-dev392.cp01 temp]$ sed -i 's/wang/zhang/g' sed.txt

# 替换两个或多个空格为一个空格

 

sed 's/[ ][ ]*/ /g' file_name

 

# 替换两个或多个空格为分隔符:

 

sed 's/[ ][ ]*/:/g' file_name

 

# 替换成空格

 

sed 's/[[:space:]][[:space:]]*/ /g' filename

 

# 替换成分隔符:

 

sed 's/[[:space:]][[:space:]]*/:/g' filename

 

 

-e是编辑命令,用于sed执行多个编辑任务的情况下。在下一行开始编辑前,所有的编辑动作将应用到模式缓冲区中的行上。

 

 

 

sed调用

  在命令行键入命令;将sed命令插入脚本文件,然后调用sed;将sed命令插入脚本文件,并使sed脚本可执行

    sed [option] sed命令 输入文件            在命令行使用sed命令,实际命令要加单引号

    sed [option] -f sed脚本文件 输入文件     使用sed脚本文件

    sed脚本文件 [option] 输入文件            第一行具有sed命令解释器的sed脚本文件

 

 

 

 

使用sed在文本中定位文本的方式:
    x       x为一行号,比如1
    x,y     表示行号范围从x到y,如2,5表示从第2行到第5行
    /pattern/    查询包含模式的行,如/disk/或/[a-z]/
    /pattern/pattern/   查询包含两个模式的行,如/disk/disks/
    /pattern/,x  在给定行号上查询包含模式的行,如/disk/,3
    x,/pattern/  通过行号和模式查询匹配行,如 3,/disk/
    x,y!    查询不包含指定行号x和y的行

基本sed编辑命令:
    p      打印匹配行                      c/    用新文本替换定位文本
    =      显示文件行号                    s     使用替换模式替换相应模式
    a/     在定位行号后附加新文本信息        r     从另一个文本中读文本
    i/     在定位行号后插入新文本信息        w     写文本到一个文件
    d      删除定位行                      q     第一个模式匹配完成后退出或立即退出
    l      显示与八进制ASCII代码等价的控制字符        y  传送字符
    n      从另一个文本中读文本下一行,并附加在下一行   {}     在定位行执行的命令组
    g      将模式2粘贴到/pattern n/

基本sed编程举例:
    使用p(rint)显示行: sed -n '2p' temp.txt   只显示第2行,使用选项n
    打印范围:  sed -n '1,3p' temp.txt         打印第1行到第3行
    打印模式:  sed -n '/movie/'p temp.txt     打印含movie的行
    使用模式和行号查询:  sed -n '3,/movie/'p temp.txt   只在第3行查找movie并打印
    显示整个文件:  sed -n '1,$'p temp.txt      $为最后一行
    任意字符:  sed -n '/.*ing/'p temp.txt     注意是.*ing,而不是*ing
    打印行号:  sed -e '/music/=' temp.txt
    附加文本:(创建sed脚本文件)chmod u+x script.sed,运行时./script.sed temp.txt
        #!/bin/sed -f
        /name1/ a/             #a/表示此处换行添加文本
        HERE ADD NEW LINE.     #添加的文本内容
    插入文本: /name1/ a/ 改成 4 i/ 4表示行号,i插入
    修改文本: /name1/ a/ 改成 /name1/ c/ 将修改整行,c修改
    删除文本: sed '1d' temp.txt  或者 sed '1,4d' temp.txt
    替换文本: sed 's/source/OKSTR/' temp.txt     将source替换成OKSTR
             sed 's//$//g' temp.txt             将文本中所有的$符号全部删除
             sed 's/source/OKSTR/w temp2.txt' temp.txt 将替换后的记录写入文件temp2.txt
    替换修改字符串: sed 's/source/"ADD BEFORE" &/p' temp.txt
             结果将在source字符串前面加上"ADD BEFORE",这里的&表示找到的source字符并保存
    sed结果写入到文件: sed '1,2 w temp2.txt' temp.txt
                     sed '/name/ w temp2.txt' temp.txt
    从文件中读文本: sed '/name/r temp2.txt' temp.txt
    在每列最后加文本: sed 's/[0-9]*/& Pass/g' temp.txt
    从shell向sed传值: echo $NAME | sed "s/go/$REP/g"   注意需要使用双引号

快速一行命令:
    's//.$//g'         删除以句点结尾行
    '-e /abcd/d'       删除包含abcd的行
    's/[][][]*/[]/g'   删除一个以上空格,用一个空格代替
    's/^[][]*//g'      删除行首空格
    's//.[][]*/[]/g'   删除句号后跟两个或更多的空格,用一个空格代替
    '/^$/d'            删除空行
    's/^.//g'          删除第一个字符,区别  's//.//g'删除所有的句点
    's/COL/(.../)//g'  删除紧跟COL的后三个字母
    's/^////g'         删除路径中第一个/

///////////////////////////////////////////////////////////////////////

、使用句点匹配单字符    句点“.”可以匹配任意单字符。“.”可以匹配字符串头,也可以是中间任意字符。假定正在过滤一个文本文件,对于一个有1 0个字符的脚本集,要求前4个字符之后为X C,匹配操作如下:. . . .X C. . . .
2、在行首以^匹配字符串或字符序列    ^只允许在一行的开始匹配字符或单词。在行首第4个字符为1,匹配操作表示为:^ . . . 1
3、在行尾以$匹配字符串或字符    可以说$与^正相反,它在行尾匹配字符串或字符, $符号放在匹配单词后。如果在行尾匹配单词j e t 0 1,操作如下:j e t 0 1 $    如果只返回包含一个字符的行,操作如下:^ . $
4、使用*匹配字符串中的单字符或其重复序列    使用此特殊字符匹配任意字符或字符串的重复多次表达式。
5、使用/屏蔽一个特殊字符的含义    有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。如果要在正则表达式中匹配以* . p a s结尾的所有文件,可做如下操作:/ * / . p a s
6、使用[]匹配一个范围或集合     使用[ ]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号),这样做可以增 加模式的可读性。使用“ -”表示一个字符串范围,表明字符串范围从“ -”左边字符开始,到“ -”右边字符结束。假定要匹配任意一个数字,可以使用:[ 0 1 2 3 4 5 6 7 8 9 ]    要匹配任意字母,则使用:[ A - Z a - z ]表明从A - Z、a - z的字母范围。
7、使用/{/}匹配模式结果出现的次数    使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用/ { / },此模式有三种形式,即:
    pattern/{n/} 匹配模式出现n次。
    pattern/{n,/} 匹配模式出现最少n次。
    pattern/{n,m} 匹配模式出现n到m次之间,n , m为0 - 2 5 5中任意整数。
    匹配字母A出现两次,并以B结尾,操作如下:A / { 2 / } B匹配值为A A B    匹配A至少4次,使用:A / { 4 , / } B

替换单引号为空:

可以这样写:
sed 's/'"'"'//g' 
sed 's/'\''//g'

sed s/\'//g

 

可视化正则表达式

https://regexper.com/

转载于:https://my.oschina.net/hnuweiwei/blog/685656

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值