grep博大精深,本文仅持续更新在工作中频繁使用的方法。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
获取不是空行和注释的内容:
grep ^[^#]  file1
grep -v "^#"|grep -v "^$" file1
grep -Ev "^#|^$" file1
 
获取指定内容:
grep "05/Mar/2013" origin.log > 0305.log
 
颜色显示:
grep --color
 
grep -E 
 
提取统计日志中,关于http code的4xx,5xx和0结尾的行
awk '{count[$2]+=$1};END{for (c in count) print c, count[c]}' *.stat |sort |uniq |sort -nr |awk '$1>100 {print $0}' |grep -E '(^[0-9]+ [4-5][0-9][0-9]$)|(^[0-9]+ 0$)' |more
46255 0
967 504
218 502
2 403
1 503
 
grep -o  仅显示匹配的字符
获取IP
grep -o -E "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}"
 
grep -Po  使用 perl 的正则表达式,典型应用是零宽断言,以下是示例:
获取字符串:access.xxxx.log 中间的 xxxx,即:在 "access." 和 ".log" 中间的字符串
# echo '/var/log/nginx/access.www.test.com-443.log' |grep -Po '(?<=access.).*(?=.log)'
www.test.com-443
进一步只匹配 ".com" 结尾的字符串:
# echo '/var/log/nginx/access.www.test.com-8080.log' |grep -Po '(?<=access.).*.com(?=-\d+.log|.log)'     
www.test.com
# echo '/var/log/nginx/access.www.test.com.log' |grep -Po '(?<=access.).*.com(?=-\d+.log|.log)'     
www.test.com
 
 
打印文件名:
grep --color -H "^wget" /home/web/task/crontab_*.sh 
 
 
获取url的最右一列的名字
for in $(grep "^wget" /home/web/task/crontab_*.sh |cut -d' ' -f2); do echo ${i##*/};done |sort -n |uniq
 
 
查找某个目录下包含某个字符文件:
 
# grep 'svn_url_port_filter' -nr .
./lib/svn.php:21:  $url = svn_url_port_filter($url);    
./lib/svn.php:71:    $url = svn_url_port_filter($url);
./lib/svn.php:80:    $url = svn_url_port_filter($url);
./lib/svn.php:229:function svn_url_port_filter($url) 
 
或者
# find . -exec grep -nH 'svn_url_port_filter' {} \;
./lib/svn.php:21:  $url = svn_url_port_filter($url);    
./lib/svn.php:71:    $url = svn_url_port_filter($url);
./lib/svn.php:80:    $url = svn_url_port_filter($url);
./lib/svn.php:229:function svn_url_port_filter($url)