grep 是一种强大的命令行工具,用于在一个或多个输入文件中搜索与正则表达式匹配的行,并将匹配的行标准输出。
1.基本搜索
参数 说明
-i 忽略大小写进行匹配
-w 只匹配完整的单词
-x 只匹配与整行完全匹配的行
-v 反向匹配,显示不匹配的行
-q 静默模式,不输出任何内容,仅返回状态码
grep -i "pattern" file.txt
grep -w "word" file.txt
grep -x "line" file.txt
grep -v "pattern" file.txt
grep -q "pattern" file.txt
2.输出控制
参数 说明
-n 显示匹配行的行号
-H 显示文件名
-h 不显示文件名
-m n 最多显示 n 行匹配结果
–color 高亮显示匹配部分
grep -n "pattern" file.txt
grep -H "pattern" file.txt
grep -h "pattern" file.txt
grep -m 5 "pattern" file.txt
grep --color "pattern" file.txt
3.文件处理
参数 说明
-r 或 -R 递归搜索目录中的文件
-d action 指定目录的处理方式(read、skip、recurse)
-D action 指定设备文件的处理方式(read、skip)
-s 静默模式,忽略不存在的文件或读取错误
grep -r "pattern" /path/to/directory
grep -d skip "pattern" /path/to/directory
grep -D skip "pattern" /dev/sda
grep -s "pattern" file.txt
4.匹配模式
参数 说明
-e pattern 指定搜索模式,可多次使用
-f file 从文件中读取搜索模式
-E 启用扩展正则表达式
-F 将模式视为固定字符串,而非正则表达式
-G 强制使用基本正则表达式
-P 启用 Perl 兼容正则表达式(PCRE)
grep -e "pattern1" -e "pattern2" file.txt
grep -f patterns.txt file.txt
grep -E "pattern" file.txt
grep -F "pattern" file.txt
grep -G "pattern" file.txt
grep -P "pattern" file.txt
5.上下文显示
参数 说明
-A n 显示匹配行后的 n 行
-B n 显示匹配行前的 n 行
-C n 显示匹配行前后的 n 行
grep -A 2 "pattern" file.txt
grep -B 2 "pattern" file.txt
grep -C 2 "pattern" file.txt
6.统计和计数
参数 说明
-c 显示匹配行的数量
-L 显示没有匹配的文件名
-l 显示匹配的文件名
-o 只显示匹配的部分
-Z 以 NULL 字符分隔文件名(适用于 xargs)
grep -c "pattern" file.txt
grep -L "pattern" file1.txt file2.txt
grep -l "pattern" file1.txt file2.txt
grep -o "pattern" file.txt
grep -Z "pattern" file.txt
7.其他选项
参数 说明
-V 显示版本信息
grep -V
-u 强制输出为 UTF-8 编码
grep -u "pattern" file.txt
-z 将输入视为 NULL 分隔的行
grep -z "pattern" file.txt
–exclude=glob 排除匹配 glob 的文件
grep --exclude=*.log -r "pattern" /path/to/directory
–include=glob 只搜索匹配 glob 的文件
grep --include=*.txt -r "pattern" /path/to/directory
–files-with-matches 只显示匹配的文件名
grep --files-with-matches "pattern" file.txt
–files-without-match 只显示没有匹配的文件名
grep --files-without-match "pattern" file.txt
–label=label 为输出添加标签
grep --label="my_label" "pattern" file.txt
–binary-files=type 指定二进制文件的处理方式(binary、text、without-match)
grep --binary-files=text "pattern" file.bin
–text 将二进制文件视为文本处理
grep --text "pattern" file.bin
–null-data 将空文件视为匹配
grep --null-data "pattern" file.txt
–max-count=n 最多匹配 n 次后停止
grep --max-count=5 "pattern" file.txt
–line-buffered 使用行缓冲输出
grep --line-buffered "pattern" file.txt
–mmap 使用内存映射读取文件
grep --mmap "pattern" file.txt
–perl-regexp 启用 Perl 兼容正则表达式(同 -P)
grep --perl-regexp "pattern" file.txt
–basic-regexp 强制使用基本正则表达式(同 -G)
grep --basic-regexp "pattern" file.txt
–extended-regexp 启用扩展正则表达式(同 -E)
grep --extended-regexp "pattern" file.txt
–fixed-strings 将模式视为固定字符串(同 -F)
grep --fixed-strings "pattern" file.txt
–auto-call 自动调用 --color 如果输出是终端
grep --auto-color "pattern" file.txt
–color=when 指定何时高亮显示匹配部分(never、always、auto)
grep --color=always "pattern" file.txt
–context[=n] 显示匹配行前后的 n 行(同 -C)
grep --context=2 "pattern" file.txt
–before-context[=n] 显示匹配行前的 n 行(同 -B)
grep --before-context=2 "pattern" file.txt
–after-context[=n] 显示匹配行后的 n 行(同 -A)
grep --after-context=2 "pattern" file.txt
–group-separator=string 指定分隔匹配组的字符串
grep --group-separator="---" -A 2 -B 2 "pattern" file.txt
#该命令会在 file.txt 文件中查找包含 pattern 的行,并显示匹配行前后的上下文行(匹配行前 2 行和后 2 行)。同时,匹配内容之间会以 --- 作为分隔符。
–binary 将文件视为二进制文件
grep --binary "pattern" file.txt
–text 将文件视为文本文件(同 --text)
grep --text "pattern" file.txt
–ignore-case 忽略大小写(同 -i)
grep --ignore-case "pattern" file.txt
–word-regexp 只匹配完整的单词(同 -w)
grep --word-regexp "word" file.txt
–line-regexp 只匹配与整行完全匹配的行(同 -x)
grep --line-regexp "line" file.txt
–invert-match 反向匹配(同 -v)
grep --invert-match "pattern" file.txt
–quiet 静默模式(同 -q)
grep --quiet "pattern" file.txt
–silent 静默模式(同 -q)
grep --silent "pattern" file.txt
–no-messages 静默模式,不显示错误信息
grep --no-messages "pattern" file.txt
–directories=action 指定目录的处理方式(read、skip、recurse)(同 -d)
grep --directories=skip "pattern" /path/to/directory
–devices=action 指定设备文件的处理方式(read、skip)(同 -D)
grep --devices=skip "pattern" /dev/sda
–labels 显示标签
grep --labels "pattern" file.txt
–null 以 NULL 字符分隔输出
grep --null "pattern" file.txt
–null-data 将空文件视为匹配(同 --null-data)
grep --null-data "pattern" file.txt
–only-matching 只显示匹配的部分(同 -o)
grep --only-matching "pattern" file.txt
–file=file 从文件中读取搜索模式(同 -f)
grep --file=patterns.txt file.txt
–fixed-strings 将模式视为固定字符串(同 -F)
grep --fixed-strings "pattern" file.txt
–basic-regexp 强制使用基本正则表达式(同 -G)
grep --basic-regexp "pattern" file.txt
–extended-regexp 启用扩展正则表达式(同 -E)
grep --extended-regexp "pattern" file.txt
–perl-regexp 启用 Perl 兼容正则表达式(同 -P)
grep --perl-regexp "pattern" file.txt
–binary-files=type 指定二进制文件的处理方式(同 --binary-files)
grep --binary-files=text "pattern" file.bin
–mmap 使用内存映射读取文件(同 --mmap)
grep --mmap "pattern" file.txt
–line-buffered 使用行缓冲输出(同 --line-buffered)
grep --line-buffered "pattern" file.txt
–max-count=n 最多匹配 n 次后停止(同 --max-count)
grep --max-count=5 "pattern" file.txt
–color=when 指定何时高亮显示匹配部分(同 --color)
grep --color=always "pattern" file.txt
综合示例
递归搜索目录中的文件并忽略大小写:
grep -ri "pattern" /path/to/directory
显示匹配行的行号和文件名:
grep -Hn "pattern" file.txt
高亮显示匹配部分并限制输出行数:
grep --color -m 5 "pattern" file.txt
递归搜索并显示匹配的文件名:
grep -rl "pattern" /path/to/directory
使用 Perl 兼容正则表达式:
grep -P "\d+" file.txt
grep 命令中与正则表达式相关的参数及其详细说明:
1.基本正则表达式(BRE)
参数 说明
. 匹配任意单个字符(换行符除外)
^ 匹配行首
$ 匹配行尾
[] 匹配字符集合中的任意一个字符
[^] 匹配不在字符集合中的任意一个字符
*匹配前一个字符零次或多次
{n,m} 匹配前一个字符 n 到 m 次
\ 转义特殊字符
grep "a.c" file.txt 匹配 abc、a1c 等
grep "^aa" file.txt 匹配以 aa 开头的行
grep "aa$" file.txt 匹配以 aa 结尾的行
grep "[abc]" file.txt 匹配包含 a、b 或 c 的行
grep "[^abc]" file.txt 匹配不包含 a、b 或 c 的行
grep "go*gle" file.txt 匹配 ggle、google 等
grep "a\{2,4\}" file.txt 匹配 aa、aaa、aaaa
grep "\$10" file.txt 匹配 $10
2.扩展正则表达式(ERE)
参数 说明
-E 或 --extended-regexp 启用扩展正则表达式
grep -E "pattern" file.txt
+匹配前一个字符一次或多次
grep -E "go+gle" file.txt 匹配 gogle、google
? 匹配前一个字符零次或一次
grep -E "colou?r" file.txt 匹配 color、colour
| 逻辑或,匹配多个模式之一
grep -E "error|warn" file.txt匹配error或warn
() 分组表达式
grep -E "(ab)+" file.txt 匹配 ab、abab
{n,m} 匹配前一个字符 n 到 m 次(无需转义)
grep -E "a{2,4}" file.txt 匹配 aa、aaa、aaaa
实际应用示例
匹配 IP 地址:
grep -E "([0-9]{1,3}\.){3}[0-9]{1,3}" log.txt
正则表达式解释
[0-9]{1,3}:匹配 1 到 3 位的数字。
\.:匹配点号(.),因为点号在正则表达式中是一个特殊字符,需要用反斜杠 \ 进行转义。
([0-9]{1,3}\.){3}:匹配三个由数字和点号组成的段(例如 192.168.0.)。
[0-9]{1,3}:匹配最后一段数字(例如 1 或 255)。
匹配类似 192.168.1.1 的 IP 地址。
匹配邮箱地址:
grep -E "[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}" users.csv
正则表达式解释
[a-zA-Z0-9._%+-]+:匹配电子邮件地址的用户名部分,可以包含字母(大小写)、数字、点(.)、下划线(_)、百分号(%)、加号(+)和短横线(-)。
@:匹配电子邮件地址中的 @ 符号。
[a-zA-Z0-9.-]+:匹配电子邮件地址的域名部分,可以包含字母(大小写)、数字、点(.)和短横线(-)。
\.:匹配域名中的点号(.),因为点号在正则表达式中是一个特殊字符,需要用反斜杠 \ 进行转义。
[a-zA-Z]{2,}:匹配顶级域名(如 .com、.org),要求至少包含两个字母。
匹配类似 user@example.com 的邮箱地址。
匹配以特定字符串开头的行:
grep "^example" file.txt
匹配以 example 开头的行。
匹配以特定字符串结尾的行:
grep "example$" file.txt
匹配以 example 结尾的行。
匹配包含任意字符的字符串:
grep "a..a" file.txt
匹配类似 a12a、aBa 的字符串。
获取nginx服务acess.log中今天9.30到10.30的日志,只要ip地址,url,状态码。
grep -E '\[.*?:09:(3[0-9]|4[0-9]|5[0-9]):[0-9]{2} \+.*\]|\[.*?:10:([0-2][0-9]|30):[0-9]{2} \+.*\]' /var/log/nginx/access.log
#获取09点-10点的
grep -E '\[.*?:09:[0-9]{2}:[0-9]{2} \+.*\]|\[.*?:10:[0-9]{2}:[0-9]{2} \+.*\]' /var/log/nginx/access.log