我们一起来玩转 Grep 指令

本文详细介绍了Linux中grep指令的基本用法,包括其语法结构、选项分类以及经典应用场景。通过实例展示了如何查找文件中特定字符串、忽略大小写、反向匹配、统计匹配行数、获取上下文内容等操作,帮助读者掌握这一强大的文本过滤工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

导读grep这个linux指令大家一定不陌生,其用于查找文件中符合条件的字符串,下面来看看这个高频的指令如何使用。

在一个阳光明媚、晴空万里的中午,一个挠头的程序员正在与团队一姐排查超时问题,只见一姐手速极快的查找着一个又一个日志,快速定位到一个又一个嫌疑人,仰慕之情油然而生,为了后续也能够在小迷妹手上秀技术,所以暗下决心准备学习这个牛逼的东西。下面有请今天的主角(grep指令)闪亮登场。

一、基本语法

grep这个linux指令大家一定不陌生,其用于查找文件中符合条件的字符串,下面来看看这个高频的指令如何使用。

grep [选项] 查找内容 [源文件]

观察其组成结构,由四部分组成:指令名(grep)、选项、查找内容、源文件,其中需要注意的有两个位置,下面让我们徐徐道来。

源文件

源文件部分是可有可无的,若不指定任何文件名称或是所给予的文件名为-,则grep指令会从标准输入设备读取数据,其使用如下所示:

// 文件路径为/test

// 接收cat的输入
cat ./test |grep 'hello'

// 存在路径部分参数
grep 'hello' ./test

选项部分

选项部分比较多,可以通过grep --help指令来看一下有哪些选项:

Regexp selection and interpretation: // 正则表达式选择和解释
-E, --extended-regexp PATTERN is an extended regular expression (ERE)
-F, --fixed-strings PATTERN is a set of newline-separated strings
-G, --basic-regexp PATTERN is a basic regular expression (BRE)
-P, --perl-regexp PATTERN is a Perl regular expression
-e, --regexp=PATTERN use PATTERN for matching
-f, --file=FILE obtain PATTERN from FILE
-i, --ignore-case ignore case distinctions
-w, --word-regexp force PATTERN to match only whole words
-x, --line-regexp force PATTERN to match only whole lines
-z, --null-data a data line ends in 0 byte, not newline

Miscellaneous: // 各种各样的
-s, --no-messages suppress error messages
-v, --invert-match select non-matching lines // 搜索不匹配的行
-V, --version display version information and exit
--help display this help text and exit

Output control: // 输出控制
-m, --max-count=NUM stop after NUM matches
-b, --byte-offset print the byte offset with output lines
-n, --line-number print line number with output lines
--line-buffered flush output on every line
-H, --with-filename print the file name for each match
-h, --no-filename suppress the file name prefix on output
--label=LABEL use LABEL as the standard input file name prefix
-o, --only-matching show only the part of a line matching PATTERN
-q, --quiet, --silent suppress all normal output
--binary-files=TYPE assume that binary files are TYPE;
TYPE is 'binary', 'text', or 'without-match'
-a, --text equivalent to --binary-files=text
-I equivalent to --binary-files=without-match
-d, --directories=ACTION how to handle directories;
ACTION is 'read', 'recurse', or 'skip'
-D, --devices=ACTION how to handle devices, FIFOs and sockets;
ACTION is 'read' or 'skip'
-r, --recursive like --directories=recurse
-R, --dereference-recursive likewise, but follow all symlinks
--include=FILE_PATTERN search only files that match FILE_PATTERN
--exclude=FILE_PATTERN skip files and directories matching FILE_PATTERN
--exclude-from=FILE skip files matching any file pattern from FILE
--exclude-dir=PATTERN directories that match PATTERN will be skipped.
-L, --files-without-match print only names of FILEs containing no match
-l, --files-with-matches print only names of FILEs containing matches
-c, --count print only a count of matching lines per FILE
-T, --initial-tab make tabs line up (if needed)
-Z, --null print 0 byte after FILE name

Context control: // 上下文控制
-B, --before-context=NUM print NUM lines of leading context
-A, --after-context=NUM print NUM lines of trailing context
-C, --context=NUM print NUM lines of output context
-NUM same as --context=NUM
--color[=WHEN],
--colour[=WHEN] use markers to highlight the matching strings;
WHEN is 'always', 'never', or 'auto'
-U, --binary do not strip CR characters at EOL (MSDOS/Windows)
-u, --unix-byte-offsets report offsets as if CRs were not there

看着选项内容真的很多,背起来着实不易,幸好文档中给我们做了分类,只需要记住这些分类是干什么的,然后在需要的时候从里面进行搜索即可快速搜寻到所需用法(感觉看其内容必看菜鸟教程上的内容容易很多)

(1)当需要通过正则的方式进行搜索内容时,去"Regexp selection and interpretation"区块找选项即可,常用的有:

-E:通过正则表达式进行搜索

(2)当需要对输出的内容进行控制时,去"Output control"区块找选项即可,常用的有如下几个:

-m 数量:表征匹配多少次就会停止
-n:显示匹配行及行号
-H:打印每一个匹配的文件名
-r:能够递归查询,即可以输入文件夹查询
-c:统计匹配到行的个数

(3)当需要获取输出内容的上下文进行操纵时,去"Context control"区块找选项即可,常用的有如下几个:

-B 数量、-A 数量、-C 数量:分别表征获取内容前、后、前后几行
--color:对输出的内容添加颜色

(4)除了一些划分比较理解的选项,还有一些选项我个人认为划分的并不是很合理,但是它们仍然很重要,让我们一起来看看有哪些:

-i:忽略字母大小写
-v:反向选择,也就是显示出没有搜索出字符串内容的那一行

二、经典用法

上面已经将其基本使用做了详细的阐述,俗话说的好:光说不练假把式,光练不说真把式,连说带练全把式。既然上面阐述了一通理论的东西,下面我们就来实战几个常用场景,将理论付诸于实践。在实战之前先创建一个文件,文件名是test,文件内容如下所示:

hello world!!!
dog
cat
pig
big pig
tiger
Elephant

从确定文件中过滤出包含pig的

$ grep 'pig' ./test
pig
big pig

从包含某一部分内容的文件中过滤包含pig的

$ grep 'pig' ./te*
pig
big pig

从某一文件夹下所有内容中过滤出包含pig的

$ grep -r 'pig' .
./test:pig
./test:big pig

从某一文件中过滤出不包含pig的

$ grep -v 'pig' ./test
hello world!!!
dog
cat
tiger
Elephant

在过滤文件时显示行数

$ grep -n 'pig' ./test
4:pig
5:big pig

匹配出以开头的内容(通过基本正则表达式匹配即可,基本正则表达式字符有^$.[]*)

$ grep ^p ./test
pig

匹配出包含pig或cat内容的行(用到了扩展正则表达式,其在基本正则表达式基础上增加了(){}?+|等)

$ grep -E 'pig|cat' ./test
cat
pig
big pig

匹配出包含hello和world内容的行

$ grep 'hello' ./test |grep 'world'
hello world!!!

获取到匹配内容‘big pig'的前一行内容

$ grep -B1 'big pig' ./test
pig
big pig

获取匹配到'pig'行的数量

$ grep -c 'pig' ./test

获取到的pig行的内容高亮显示

$ grep --color 'pig' ./test
pig
big pig

经典用法还有很多,不能再一一进行罗列了,只需要知道在过滤内容时用此技巧能解决80%的问题,但这就足够让自己成为最亮的那个崽。www.linuxprobe.com

### Grep 命令基础 GrepLinux 和 Unix 系统中的一个重要文本搜索工具,用于在文件中查找包含指定模式的行。它支持正则表达式以及多种选项来增强其功能[^3]。 #### 基本语法 `grep [选项] 模式 文件名` 其中: - **选项**:控制 grep 的行为。 - **模式**:要搜索的内容或正则表达式。 - **文件名**:目标文件列表。 --- ### 常见用法 #### 1. 查找以特定单词开头或结尾的行 可以使用 `^` 表示行首,`$` 表示行尾。例如: ```bash grep -E "^hello" *.cpp # 找出以 "hello" 开头的所有 cpp 文件中的行 grep -E "world$" *.cpp # 找出以 "world" 结尾的所有 cpp 文件中的行 ``` 上述命令分别匹配以 “hello” 开始和以 “world” 结束的行[^1]。 #### 2. 组合其他命令完成复杂任务 Grep 可与 find 配合使用,从而在整个目录结构中定位含有某些关键字的文件。例如: ```bash find /path/to/search -type f -exec grep 'pattern' {} \; ``` 此命令会在 `/path/to/search` 路径下找到所有普通文件并检查它们是否包含字符串 `'pattern'`[^2]。 #### 3. 正则表达式的高级应用 如果需要更复杂的匹配条件,则可利用扩展正则表达式 (ERE) 或 Perl 兼容正则表达式 (PCRE),如下所示: ```bash grep "9\{2,3\}" test.txt # 显示每行中有连续两个或者三个数字“9”的那些行 ``` 这里 `\{min,max\}` 定义了一个量词区间,允许最小两次最大三次重复前导字符[^5]。 #### 4. 输出上下文信息 为了更好地理解匹配项的位置关系,还可以加上 `-A`, `-B`, 或者 `-C` 参数展示额外几行作为背景资料: ```bash grep -A 2 error log.txt # 列出错误日志及其后的两行记录 grep -B 1 warning config.conf # 提供警告消息之前的单条语句预览 grep -C 3 success report.log # 同时附带成功状态周围的三行情景描述 ``` #### 5. 忽略大小写敏感度 当不区分字母大小写时加入 `-i` 标记即可简化操作流程: ```bash grep -i email addresses.csv # 不论 Email 还是 EMAIL 都会被识别出来 ``` #### 6. 计算符合条件的结果数量 统计满足给定规则的数据总数非常简单只需附加 `-c` 即可得到计数值而非具体内容本身: ```bash grep -c failed audit.log # 返回失败审计事件发生的总次数 ``` #### 7. 排除不需要的部分 有时可能想排除掉一些干扰因素这时可以用到反向选择机制即通过 `-v` 实现过滤效果: ```bash grep -v commented code.py # 屏蔽掉被注释掉的功能部分只保留实际运行逻辑代码片段 ``` --- ### 总结 掌握以上这些技巧能够极大提升工作效率减少繁琐的手动筛选过程让开发者专注于更重要的业务需求之上。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值