shell常用命令之grep、sed、awk

本文详细介绍Linux下grep、sed和awk三种强大的文本处理工具。grep用于搜索文本中的模式,sed擅长文本流编辑,awk则适用于复杂的数据处理。文章涵盖各种实用命令和示例,帮助读者掌握这些工具的高级用法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

grep

Global search Regular Expression and Print out the line
全面搜索研究正则表达式并显示出来 grep命令是一种强大的文本搜索工具,根据用户指定的“模式”对目标文件进行批匹配检查,打印匹配到的行
由正则表达式或者字符及文本字符所编辑的过滤条件

grep中字符定位

-i	##忽略字母大小写
-v	##条件取反
-c	##统计匹配行数
-q	##静默,无任何输出
-n	##显示匹配结果所在的行号
\<  ##关键字左边不能有其他字符(不包含特殊字符)
>\  ##关键字右边不能有其他字符(不包含特殊字符)

(1)普通过滤关键字

grep root passwd

在这里插入图片描述

(2)忽略大小写

grep -i root passwd

在这里插入图片描述

(3)关键字左边不能有其他字符(不包含特殊字符)

grep "\<root" passwd

在这里插入图片描述

(4)关键字右边不能有其他(不包含特殊字符)

grep "root\>" passwd

在这里插入图片描述

(5)关键字左右不能有其他(不包含特殊字符)

grep "\<root\>" passwd

在这里插入图片描述

(6)以关键字开头

^关键字 以关键字开头

(7)以关键字结尾

关键字$ 以关键字结尾
grep -E "^root\>|\<root$" passwd   ##因为有 | ,需要扩展-E(extend)
egrep "^root\>|\<root$" passwd

在这里插入图片描述

(8)-v 反向过滤,不包含的所有

grep -E "^root\>|\<root$" passwd -v
grep -E "^root\>|\<root$" passwd -v | grep root
grep -E "^root\>|\<root$" passwd -v | grep "\<root\>"

在这里插入图片描述

过滤指定字符
正则表达式:对于特殊字符需要转义\,并且加上双引号
(2)grep 中字符的匹配次数设定

*        字符出现 [0- 任意次 ]
?        字符出现 [0-1 次 ]
+        字符出现 [1- 任意次 ]
{n}      字符出现 [n 次 ]
{m,n}    字符出现 [ 最少出现 m 次,最多出现 n 次 ]
{0,n}    字符出现 [0-n 次 ]
{m,}     字符出现 [ 至少 m 次 ]
(xy){n}  xy关键字出现 [n 次 ] 
.*       关键字之间匹配任意字符
{}大括号内的内容属于哪一个程序
()括号内属于一个整体

在这里插入图片描述

在这里插入图片描述

sed

sed stream editor(行编辑器)
用来操作纯 ASCII 码的文本处理时 , 把当 前处理的行存储在临时缓冲区中 ,
称为“模式空间” (pattern space) 可以指定仅仅处理哪些行。
sed符合模式条件的处理不符合条件的不予处理,处理完成之后把缓冲区的内容送往屏幕接着处理下一行 , 这样不断重复 , 直到文件末尾。

sed对字符的处理

p  显示
d  删除
a  添加
c  替换
w  写入
i  插入

p操作模式
显示fstab以#开头的行

sed -n '/^#/p' fstab

在这里插入图片描述

不显示以#开头的行

sed -n ‘/^#/!p’ fstab
在这里插入图片描述

显示fstab的2-6行

cat -n fstab | sed -n '2,6p'

显示fstab的第2行和第6行

cat -n fstab | sed -n -e '2p;6p'
cat -n fstab | sed -n -e '2p' -e '6p'

d操作模式

不显示空行

sed -e '/^$/d' fstab

不显示空行和以#开头的行

sed -e '/^$/d;/^#/d' fstab

不显示4-6行

cat -n fstab | sed '4,6d'

-n:抑制模式空间的输出

a操作模式

在fstab文件中以UU开头的行后面加hello并换行加world

sed '/^UU/ahello\nworld' fstab

在这里插入图片描述

i操作模式

将指定内容插入在UU前面
sed '/^UU/ihello\nworld' fstab在这里插入图片描述

c操作模式

将#替换成hello
sed '/^#/chello' fstab在这里插入图片描述

w操作模式

把fstab中以#开头的写入文件testfile

sed -n '/^#/w /mnt/testfile' fstab
sed -n '/^#/p' fstab >testfile

在这里插入图片描述

sed的其他用法

=       表示加入行号;
6r      表示将文件写入第6行下一行;
N       表示每一行添加换行符
G       表示每行后面插入空行
-n '$p' 显示文件最后一行
-i      改变原文件的内容
-f      在文件中写替换策略,调用文件替换

显示fstab中的行号并与内容分开

sed '/^#/=' fstab

仅仅显示某一行的行号

sed -n '/^UUID/=' fstab

将行号和内容显示到一行

sed -ne '/^UUID/=;/^UUID/p' fstab | sed 'N;s/\n/ /g'  ##将换行符号替换为空格

在这里插入图片描述

将hello中的内容加入到fstab中第五行之后

sed '5r /mnt/hello' /mnt/fstab

在这里插入图片描述

使用文件替换3-5行的#
在这里插入图片描述
加入行号并将换行符替换为空格
在这里插入图片描述
加入行好并插入到文件
在这里插入图片描述
1-3行替换nologin为bash
在这里插入图片描述
第一行和第三行替换,-e表示继续执行
在这里插入图片描述
将bin到lp之间的行的nologin替换为bash

在这里插入图片描述
将/替换为空格,因为文件中的/与命令中的/相同,故需要用\转义将其区分
或者用@代替/执行命令
在这里插入图片描述
G插入空格
在这里插入图片描述
最后一行没有空格

sed '$!G' passwd

在这里插入图片描述

``与$(区别
$()在bash版本中肯定可以使用
倒引号对每一个版本都支持

awk

awk 处理机制:
awk会逐行处理文本,支持在处理第一行之前做一些准备工作,以及在处理完最后以行做一些总结性质的工作,在命令格式上分别体现如下:
BEGIN{}:读入第一行文本之前执行,一般用来初始化操作; {}:逐行处理,逐行读入文本执行相应的处理,是最常见的编辑指令;
END{}:处理完最后一行文本之后执行,一般用来输出处理结果;

NR 行
NF 列
{} 精确匹配
[] 模糊匹配

加法运算

awk 'BEGIN{n=100;print n+100}'

在这里插入图片描述
以分号为分隔符,输出第一列并以hello开头以end结尾

awk -F : 'BEGIN{print "hello"}{print $1}END{print "end"}' passwd

输出文件名

awk -F : '{print FILENAME}' passwd

输出行数与列数

awk -F : '{print NR,NF}' passwd

在这里插入图片描述
输出以bash结尾的行数

awk 'BEGIN{N=0}/bash$/{n++}END{print n}' passwd

输出以a-d开头的

awk '/^[a-d]/{print}' /etc/passwd

输出不以a-d开头的

awk '!/^[a-d]/{print}' /etc/passwd=awk '/^[^a-d]/{print}' /etc/passwd

输出以a开头或以bash结尾的

awk '/^a|bash$/{print}' /etc/passwd

输出以冒号为分割符以a开头,bash结尾的第一列第二列

awk -F : '/^a|bash$/{print $1,$2}' /etc/passwd

输出第6列以bin结尾的第一列和第六列

 awk -F : '$6~/bin$/{print $1,$6}' /etc/passwd

输出第6列不以bin结尾的第一列和第六列

awk -F : '$6!~/bin$/{print $1,$6}' /etc/passwd

偶数行

awk -F: 'NR % 2 == 0 {print}' /etc/passwd 

3-5行

awk -F: 'NR >=3 && NR <=5 {print }' /etc/passwd

统计文本总字段个数

awk 'BEGIN{i=0}{i+=NF}END{print i}' linux.txt

输出每一行的内容,并在每一行的第一列前加上行号

awk -F ":" '{print NR,$0}' passwd 

显示可以登陆的用户

awk -F ":" '\$6!~/^\/home/&&/bash\$/{print $1}' /etc/passwd

显示主机ip

ifconfig eth0 | awk '/inet\>/{print $2}'

在这里插入图片描述

在这里插入图片描述

<think>我们正在介绍Linux常用命令:find, grep, sed, awk, man, which, env。每个命令将包括: 1. 命令简介 2. 基本语法 3. 常用选项和参数 4. 使用场景举例 5. 注意事项(如有) 注意:根据引用[1],不同系统(如BSD和GNU)的命令可能有差异,我们以GNU版本(Linux常见)为主。 首先,我们列出这些命令的简要说明: - `find`: 在目录树中查找文件并执行操作 - `grep`: 在文件中搜索匹配模式的行 - `sed`: 流编辑器,用于文本转换 - `awk`: 强大的文本处理工具,也可用于数据提取和报告生成 - `man`: 查看命令的手册页 - `which`: 定位命令的完整路径 - `env`: 查看环境变量或设置临时环境运行程序 下面逐个详细介绍。 ### 1. `find` 命令 **简介**:在指定目录下查找文件,支持按名称、类型、时间、权限等属性搜索,并可对查找到的文件执行操作。 **基本语法**: ```bash find [路径] [表达式] ``` **常用选项**: - `-name`: 按文件名匹配(支持通配符) - `-type`: 按文件类型(f:普通文件, d:目录, l:符号链接等) - `-mtime`: 按修改时间(天数,+n表示n天前,-n表示n天内) - `-exec`: 对查找到的文件执行命令(用`{}`代表文件名,命令以`\;`结束) - `-size`: 按文件大小(如`+1M`表示大于1MB) **使用场景**: 1. 查找当前目录下所有`.txt`文件: ```bash find . -name "*.txt" ``` 2. 查找/home目录下大于1MB的文件并列出详细信息: ```bash find /home -size +1M -exec ls -l {} \; ``` 3. 删除/tmp目录下7天前的临时文件: ```bash find /tmp -type f -mtime +7 -exec rm {} \; ``` **注意事项**: - 使用通配符(如`*`)时,建议用引号括起模式(如`"*.txt"`),避免shell提前展开。 - 使用`-exec`时,`{}`和`\;`是固定格式,不可省略。 ### 2. `grep` 命令 **简介**:在文件中搜索匹配指定模式的行,支持正则表达式。 **基本语法**: ```bash grep [选项] 模式 [文件...] ``` **常用选项**: - `-i`: 忽略大小写 - `-r` 或 `-R`: 递归搜索目录 - `-n`: 显示匹配行的行号 - `-v`: 反向匹配(显示不包含模式的行) - `-E`: 使用扩展正则表达式(等同于`egrep`) **使用场景**: 1. 在当前目录所有文件中搜索包含`error`的行(忽略大小写): ```bash grep -ri "error" . ``` 2. 查找`/etc/passwd`中不含`/bin/bash`的行(即非bash用户): ```bash grep -v "/bin/bash" /etc/passwd ``` 3. 使用正则表达式匹配IP地址(需要`-E`): ```bash echo "192.168.1.1" | grep -E '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' ``` **注意事项**: - 模式中若包含特殊字符(如`$`, `*`),需用单引号括起。 - 递归搜索时,`-r`和`-R`在大多数Linux发行版中行为相同,但在某些系统(如macOS)中`-R`会跟随符号链接。 ### 3. `sed` 命令 **简介**:流编辑器,用于对输入流(文件或管道)进行文本转换(如替换、删除、插入)。 **基本语法**: ```bash sed [选项] '指令' [输入文件] ``` **常用指令**: - `s/模式/替换/`: 替换匹配模式的文本(可加`g`表示全局替换) - `d`: 删除行 - `p`: 打印行(通常与`-n`选项配合使用) - `a\text`: 在行后追加文本 - `i\text`: 在行前插入文本 **使用场景**: 1. 替换文件中的字符串(原文件不变,输出到屏幕): ```bash sed 's/foo/bar/g' file.txt ``` 2. 直接修改文件(使用`-i`选项): ```bash sed -i 's/foo/bar/g' file.txt ``` 3. 删除空白行: ```bash sed '/^$/d' file.txt ``` **注意事项**: - `-i`选项会直接修改文件,建议先备份或测试无误后再使用。 - 指令中的分隔符`/`可替换为其他字符(如`s|foo|bar|g`),避免与模式中的`/`冲突。 ### 4. `awk` 命令 **简介**:强大的文本处理工具,按行处理,自动分割字段(默认空格分隔),支持编程结构(如条件、循环)。 **基本语法**: ```bash awk '模式 {动作}' [文件] ``` **常用变量**: - `$0`: 整行内容 - `$1`, `$2`, ...: 第1、2个字段 - `NF`: 当前行的字段数 - `NR`: 当前行号 - `FS`: 输入字段分隔符(默认为空格) - `OFS`: 输出字段分隔符(默认为空格) **使用场景**: 1. 打印文件每行的第一个字段(如`/etc/passwd`的用户名): ```bash awk -F: '{print $1}' /etc/passwd ``` 2. 统计文件行数: ```bash awk 'END {print NR}' file.txt ``` 3. 计算第1列数字之和: ```bash awk '{sum+=$1} END {print sum}' data.txt ``` **注意事项**: - 指定分隔符用`-F`(如`-F:`表示冒号分隔)。 - 引用变量时无需加`$`(如`NR`),而字段需要(如`$1`)。 ### 5. `man` 命令 **简介**:查看命令、函数或配置文件的手册页(manual pages)。 **基本语法**: ```bash man [章节] 名称 ``` **常用章节**: - 1: 用户命令 - 2: 系统调用 - 3: 库函数 - 5: 文件格式(如配置文件) - 8: 系统管理命令 **使用场景**: 1. 查看`ls`命令的用法: ```bash man ls ``` 2. 查看`open`系统调用的文档(需指定章节): ```bash man 2 open ``` **注意事项**: - 按`q`退出手册页。 - 若名称同时存在于多个章节(如`printf`命令和函数),可用`man 1 printf`和`man 3 printf`区分。 ### 6. `which` 命令 **简介**:定位命令的完整路径(在`$PATH`环境变量中查找)。 **基本语法**: ```bash which 命令名 ``` **使用场景**: 1. 查看`ls`命令的路径: ```bash which ls # 输出:/bin/ls ``` 2. 检查命令是否存在: ```bash which some_command > /dev/null && echo "存在" || echo "不存在" ``` **注意事项**: - 仅搜索`$PATH`中的目录,不会查找别名或内置命令(如`cd`)。 ### 7. `env` 命令 **简介**:查看当前环境变量,或设置临时环境运行程序。 **基本语法**: ```bash env [选项] [变量=值]... [命令] ``` **使用场景**: 1. 显示所有环境变量: ```bash env ``` 2. 临时修改环境变量运行程序(如设置`LANG`): ```bash env LANG=C date ``` 3. 清除所有环境变量后运行程序(`-i`选项): ```bash env -i /path/to/program ``` **注意事项**: - 临时设置的环境变量仅影响后续执行的命令,不影响当前shell环境。 ### 总结 以上命令是Linux系统管理、文本处理和日常使用的核心工具。熟练掌握它们能极大提高工作效率。注意不同系统(如BSD和GNU)的差异,如引用[1]所述,跨平台脚本需谨慎使用这些命令或考虑Python/Perl替代。 §§相关问题§§ 1. 如何组合使用`find`和`grep`进行复杂搜索? 2. `sed`和`awk`在文本处理中有哪些典型区别? 3. 如何通过`man`手册快速查找特定选项的说明? 4. 在脚本中如何安全地使用`find`的`-exec`选项? 5. `env`命令在脚本开发中的常见用途有哪些?</think>### Linux 常用命令详解 #### 1. `find`:文件搜索工具 **用途**:在目录树中递归搜索文件,支持按名称、类型、时间、权限等条件过滤 **基本语法**: ```bash find [路径] [表达式] ``` **常用场景**: - 按名称搜索:`find /home -name "*.txt"`(查找/home下所有txt文件)[^2] - 按类型搜索:`find . -type d`(查找当前目录所有子目录) - 按时间过滤:`find /var/log -mtime -7`(查找7天内修改的文件) - 结合执行操作:`find ~ -size +10M -exec rm {} \;`(删除大于10MB的文件) **注意**:BSD和GNU版本参数有差异,跨平台需谨慎[^1] --- #### 2. `grep`:文本搜索工具 **用途**:在文件或输入流中匹配正则表达式 **基本语法**: ```bash grep [选项] 模式 [文件] ``` **常用场景**: - 基础搜索:`grep "error" /var/log/syslog`(搜索包含error的行) - 递归搜索:`grep -r "TODO" src/`(递归搜索源码目录) - 显示行号:`grep -n "pattern" file`(显示匹配行号) - 反向过滤:`grep -v "#" config.conf`(过滤注释行) **特殊技巧**: ```bash ps aux | grep "[n]ginx" # 精确匹配进程(避免匹配grep自身) ``` --- #### 3. `sed`:流编辑器 **用途**:对文本流进行替换、删除、插入等操作 **基本语法**: ```bash sed [选项] '指令' 文件 ``` **核心操作**: | 指令 | 作用 | 示例 | |----------|--------------------------|-------------------------------| | `s/old/new/` | 替换文本 | `sed 's/foo/bar/g' file` | | `/pattern/d` | 删除匹配行 | `sed '/^#/d' config` | | `5i\text` | 在第5行前插入文本 | `sed '3i\# New Line' file` | **典型场景**: - 批量替换:`sed -i.bak 's/old/new/g' *.txt`(备份并替换) - 删除空行:`sed '/^$/d' input.txt > output.txt` --- #### 4. `awk`:文本处理语言 **用途**:字段提取、数据统计、报告生成 **基本语法**: ```bash awk '模式 {动作}' 文件 ``` **核心概念**: - `$0`:整行内容 - `$1, $2...`:第1、2个字段 - `NR`:行号,`NF`:字段数 **常用场景**: - 提取字段:`awk -F: '{print $1}' /etc/passwd`(输出用户名) - 条件过滤:`awk '$3 > 1000 {print $0}' data.csv`(过滤第三列大于1000的行) - 数据统计: ```bash awk '{sum+=$1} END {print "Average:", sum/NR}' numbers.txt ``` --- #### 5. `man`:手册查看 **用途**:查看命令/系统调用的文档 **基本语法**: ```bash man [章节] 命令名 ``` **手册章节**: 1. 用户命令 2. 系统调用 3. 库函数 **技巧**: - `man -k keyword`:搜索相关手册(如`man -k "socket"`) - 导航:空格翻页,`/pattern`搜索,`q`退出 --- #### 6. `which`:命令定位 **用途**:查找命令的绝对路径 **示例**: ```bash $ which python /usr/bin/python # 显示第一个匹配路径 ``` **注意**:仅搜索`$PATH`变量中的路径 --- #### 7. `env`:环境管理 **用途**:查看/设置环境变量,临时修改环境执行命令 **常用操作**: - 查看所有环境变量:`env` - 临时修改变量: ```bash env LANG=C python script.py # 临时使用C语言环境执行 ``` - 清空环境执行:`env -i command`(无继承环境) --- ### 命令组合实战 **场景**:统计nginx日志中404错误的IP分布 ```bash grep " 404 " access.log | awk '{print $1}' | sort | uniq -c | sort -nr ``` 1. `grep`过滤404错误 2. `awk`提取IP地址(第1列) 3. `sort`排序 4. `uniq -c`统计重复次数 5. `sort -nr`按次数倒序排列 --- ### 注意事项 1. BSD(如MacOS)与GNU命令存在差异,跨平台脚本建议测试或使用Python/Perl替代[^1] 2. 变量引用用`${var}`避免歧义(如`${var}_suffix`)[^3] 3. 脚本参数处理:`$0`脚本名,`$1`第一个参数,`$#`参数个数[^2]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值