grep使用小结

最新推荐文章于 2025-09-10 19:09:10 发布

csdn产品小助手

最新推荐文章于 2025-09-10 19:09:10 发布

阅读量135

点赞数

CC 4.0 BY-SA版权

文章标签： awk php 运维

原文链接：https://yq.aliyun.com/articles/531660

grep博大精深，本文仅持续更新在工作中频繁使用的方法。

获取不是空行和注释的内容：

grep ^[^#]  file1

grep -v "^#"|grep -v "^$" file1

grep -Ev "^#|^$" file1
 
获取指定内容：

grep "05/Mar/2013" origin.log > 0305.log
 
颜色显示：

grep --color
 
grep -E 
 
提取统计日志中，关于http code的4xx，5xx和0结尾的行

awk '{count[$2]+=$1};END{for (c in count) print c, count[c]}' *.stat |sort |uniq |sort -nr |awk '$1>100 {print $0}' |grep -E '(^[0-9]+ [4-5][0-9][0-9]$)|(^[0-9]+ 0$)' |more
46255 0
967 504
218 502
2 403
1 503
 
grep -o  仅显示匹配的字符
获取IP

grep -o -E "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}"
 
grep -Po  使用 perl 的正则表达式，典型应用是零宽断言，以下是示例：

获取字符串：access.xxxx.log 中间的 xxxx，即：在 "access." 和 ".log" 中间的字符串
# echo '/var/log/nginx/access.www.test.com-443.log' |grep -Po '(?<=access.).*(?=.log)'

www.test.com-443

进一步只匹配 ".com" 结尾的字符串：
# echo '/var/log/nginx/access.www.test.com-8080.log' |grep -Po '(?<=access.).*.com(?=-\d+.log|.log)'     

www.test.com
# echo '/var/log/nginx/access.www.test.com.log' |grep -Po '(?<=access.).*.com(?=-\d+.log|.log)'     

www.test.com
 
打印文件名：

grep --color -H "^wget" /home/web/task/crontab_*.sh 
 
获取url的最右一列的名字

for i in $(grep "^wget" /home/web/task/crontab_*.sh |cut -d' ' -f2); do echo ${i##*/};done |sort -n |uniq
 
查找某个目录下包含某个字符文件：
 
# grep 'svn_url_port_filter' -nr .

./lib/svn.php:21:  $url = svn_url_port_filter($url);    

./lib/svn.php:71:    $url = svn_url_port_filter($url);

./lib/svn.php:80:    $url = svn_url_port_filter($url);

./lib/svn.php:229:function svn_url_port_filter($url) 
 
或者
# find . -exec grep -nH 'svn_url_port_filter' {} \;

./lib/svn.php:21:  $url = svn_url_port_filter($url);    

./lib/svn.php:71:    $url = svn_url_port_filter($url);

./lib/svn.php:80:    $url = svn_url_port_filter($url);

./lib/svn.php:229:function svn_url_port_filter($url)