Linux-find、grep、sed

本文详细介绍了grep与sed命令的基本用法及高级应用技巧,包括正则表达式的使用方法、grep命令的常见选项与实例、sed命令的强大编辑功能及其实际应用场景。

  1. grep命令与正则表达式

概念:正则表达式是一种匹配字符串的规则,通过字符和运算符进行构建,并通过元字符进行扩充,大部分元字符在使用时,需要使用转义符进行转义

基本规则

正则表达式描述
^起始行标记,比如^a,匹配以a开头的字符串
末尾行标记,比如a¥,匹配以a结束的字符串
.匹配任意一个字符,匹配空字符,不匹配换行符
|匹配|两边的任意一项,必须使用转义符
[^ ]匹配除括号内字符以外的字符
?匹配之前的项零次或一次,比如coo?l匹配col或cool,必须使用转义符
+匹配之前的项一次或多次,比如coo+l匹配cool,必须使用转义符
*匹配之前的项零次或多次,比如coo*l匹配col或cool、coool等等
( )创建一个用于匹配的字符串,比如ma(tr)?x匹配max或matrx,必须使用转义符
[ ]匹配包含在括号内的任意一个字符,*以及.在括号内均无特殊含义,[[:alnum:]]匹配字母或数字
[-]匹配指定范围内的一个字符
{n}匹配之前的项n次,比如 [0-9]{3},相当于[0-9][0-9][0-9],匹配一个三位数,必须使用转义符
{n,}匹配之前的项至少n次
{n,m}匹配之前的项至少n次至多m次
\转义字符,将上边的字符转为普通字符

常用例子

^[A-Za-z]+$  匹配任意一个单词

[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}匹配任意一个ip地址,但不管地址是否合法

[0-9]{4}-[0-9]{2}-[0-9]{2} 匹配日期

.匹配任意内容 ^.匹配以任意内容开头数据 ^¥匹配空白行

([])创建一个用于匹配的字符串,[]可以使匹配的字符串为多种

grep命令

作用:在文件中匹配符合条件的字符串,然后找出匹配的行,可以作为管道中的过滤器。可以使用正则表达式进行匹配,为包含匹配,只要该行含有被匹配内容,则返回该行。

格式:grep [选项][字符串] [文件名][文件名]………

选项
-n在返回的结果行之前显示匹配行的行号

-c显示有多少行匹配

-l只显示包含匹配行的文件列表

-v 仅显示不匹配的行

-r 在当前目录下的所有文件中进行匹配
使用egrep指定使用扩展的正则表达式语法,可以在使用| ? + () {}这些字符时不使用转义符,照样可以起到正则表达式的作用。常使用egrep,因为在匹配时不需要使用转义符,除非需要将特殊符号转为普通符号

eg


    grep "p" text1 查找文件中含有p的行 
    grep "pl\?e" text1
    grep "[3p]" text1查找含有p或3的行
    grep "[[:digit:]nz][^nr]*$" text1
    grep "b\(an\)\+a" text1等价于  egrep "b(an)+a" text1
    grep -n "banana" text[1-4] 在文件text1、text2、text3、text4中查找
    grep -rn  --exclude-dir=templates "insert" * 在当前目录下查找但不在templates目录下查找
    egrep "BuildMappers" * 在当前目录中查找含有"BuildMappers"的文件
    egrep -r "BuildMappers" * 在当前目录及其子目录下的查找含有"BuildMappers"的文件
    egrep -r -l "BuildMappers" * 在当前目录及其子目录下的查找含有"BuildMappers"的文件,仅显示文件名
    egrep "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}" text  
    注意:使用转义符将.转义成普通字符!!
  1. sed命令

作用:对数据进行删除、替换、新增、选取

格式:sed [选项] ‘[动作]’ [文件名] 动作中可以使用正则表达式进行匹配

选项

-n:只把经过sed命令处理过的数据输出到屏幕上,默认输出文件中所有数据

-e:允许对输入数据使用多条sed命令编辑

-i:使用sed修改的结果修改读取的文件,而不是由屏幕输出,与动作d一起使用时,无法正确删除指定行(?)

动作

s:字符串替换,用一个字符串替换另一个字符串

c:行替换,将当前行数据替换

d:删除,删除指定行

p:打印,输出指定行,必须与-n选项一起使用

a:追加,在当前行后添加一行或多行

i:插入,在当前行前插入一行或多行

字符串替换格式

sed ‘s/旧字符串/新字符串/’ 将文件中每行第一个符合条件的字符串替换

sed ‘ns/旧字符串/新字符串/’ 将文件中第n行第一个符合条件的字符串替换

sed ‘s/旧字符串/新字符串/g’ 将文件中每行所有符合条件的字符串替换

sed ‘ns/旧字符串/新字符串/g’ 将文件中第n行所有符合条件的字符串替换

注意:使用的是三个/
eg

●根据行号对指定行进行操作

sed -n ‘2p’ test.txt 打印第二行

sed ‘2,4d’ test.txt 删除第二行到第四行

sed ‘2,¥d’ test.txt 删除第二行到最后一行,¥代表最后一行

sed -n ‘2a,newline’ test.txt在第二行后添加一行,但不修改原文件

sed -i ‘2a,newline’ test.txt在第二行后添加一行,并修改原文件

●根据数据对指定行进行操作

sed ‘s/old/new/g ’ test.txt 将文件中所有字符串old替换为new,但改变原文件

sed -i ‘s/old/new/g ’ test.txt 将文件中所有字符串old替换为new,并改变原文件

sed -i -e ‘s/old/new/g ; s/boy/girl/g’ test.txt 执行多条sed命令,并改变原文件

sed -n ‘/new/p’ test.txt 打印含有new字符串的行

sed ‘/new/d’ test.txt 删除含有new字符串的指定行,不修改原文件

sed -i ‘/new/d’ test.txt 删除含有new字符串的指定行,修改原文件

sed -n ‘/new/{s/new2/new/g; p}’ test.txt 查找含有new字符串的行,然后执行{}中的命令,执行字符串替换并打印

sed -i ‘/new/{s/new2/new/g}‘ 查找含有new字符串的行,执行字符串替换,

sed ‘s/\.$/!/g’ test.txt 将文件中以.结尾的行中的点号替换为叹号

ifconfig eth0 | grep “inet addr” | sed ‘s/^.*addr://g’ 找出含有ip地址的一行,并删除inet addr:等ip地址之前的数据

ifconfig eth0 | grep “inet addr” | sed ‘s/^.*addr://g’ | sed ‘s/Bcast. *$//g’ 删除ip地址之前和之后的数据,仅剩下ip地址

●sed脚本可以存储在文件中

eg

echo -e “s/ /\t/g”>sedtab

sed -f sedtab test.txt 执行脚本,将空格替换为制表符

  1. 文件搜索命令与通配符

●各个通配符含义:

*代表任意内容

?代表匹配任意一个字符

[]匹配括号中任意一个字符

[-]匹配括号中的任意一个字符,-代表范围

[ ^]匹配不是括号中的一个字符

●find命令

格式:find [搜索范围] [搜索条件] [- exec command { } \; ]

注意:{}与\;之间有空格,但\与;之间没有空格!

作用:在系统中搜索符合条件的文件名,支持按名子、所有者、所属组、文件类型、修改时间、大小等条件进行搜索,此外,可以使用通配符进行完全匹配
eg

find / -name “hello.cpp” 搜索名为hello.cpp的文件

find / -name “hello.cpp*” 使用通配符搜索

find / -name “*”列出当前目录下所有文件

find / -iname “hello.cpp” 不区分大小写,搜索文件名为hello.cpp的文件

find / -user root 查找属于root用户的文件

find / -group group1 查找属于group1用户组的文件

find / -nouser搜索没有所有者的文件,没有所有者的文件通常为垃圾文件,通常!

find / -nogroup搜索没有所属组的文件

find / -type b 查找块设备,还可以查找其他类型文件

find / ! -type b 查找块设备以外的文件

find / -mtime +10查找十天前修改的文件,-10代表十天以内,10代表十天当天

find / -atime +10查找十天前访问过的文件

find / -ctime +10查找十天前被修改过文件属性的文件

find . -size 10k 查找当前目录下大小为10k的文件

find . -size +10k -a -size -40k查找大于10k小于40k的文件(-o是逻辑或)

find . -inum 24675 查找当前目录下i节点为24675的文件

find . -size +1G -exec rm {} \; 查找大小为1G的文件,并且删除
find . -name “*.c” -exec mv {} ./m1/ \; 查找以.c结尾的文件并移动到m1目录
find . -name “*.c” -exec mv -t ./m1/ {} \;查找以.c结尾的文件并移动到m1目录

参考
linux sed命令详解
Why does find -exec mv {} ./target/ + not work ? (on cygwin)

<think>我们正在介绍Linux常用命令:find, grep, sed, awk, man, which, env。每个命令将包括: 1. 命令简介 2. 基本语法 3. 常用选项和参数 4. 使用场景举例 5. 注意事项(如有) 注意:根据引用[1],不同系统(如BSD和GNU)的命令可能有差异,我们以GNU版本(Linux常见)为主。 首先,我们列出这些命令的简要说明: - `find`: 在目录树中查找文件并执行操作 - `grep`: 在文件中搜索匹配模式的行 - `sed`: 流编辑器,用于文本转换 - `awk`: 强大的文本处理工具,也可用于数据提取和报告生成 - `man`: 查看命令的手册页 - `which`: 定位命令的完整路径 - `env`: 查看环境变量或设置临时环境运行程序 下面逐个详细介绍。 ### 1. `find` 命令 **简介**:在指定目录下查找文件,支持按名称、类型、时间、权限等属性搜索,并可对查找到的文件执行操作。 **基本语法**: ```bash find [路径] [表达式] ``` **常用选项**: - `-name`: 按文件名匹配(支持通配符) - `-type`: 按文件类型(f:普通文件, d:目录, l:符号链接等) - `-mtime`: 按修改时间(天数,+n表示n天前,-n表示n天内) - `-exec`: 对查找到的文件执行命令(用`{}`代表文件名,命令以`\;`结束) - `-size`: 按文件大小(如`+1M`表示大于1MB) **使用场景**: 1. 查找当前目录下所有`.txt`文件: ```bash find . -name "*.txt" ``` 2. 查找/home目录下大于1MB的文件并列出详细信息: ```bash find /home -size +1M -exec ls -l {} \; ``` 3. 删除/tmp目录下7天前的临时文件: ```bash find /tmp -type f -mtime +7 -exec rm {} \; ``` **注意事项**: - 使用通配符(如`*`)时,建议用引号括起模式(如`"*.txt"`),避免shell提前展开。 - 使用`-exec`时,`{}`和`\;`是固定格式,不可省略。 ### 2. `grep` 命令 **简介**:在文件中搜索匹配指定模式的行,支持正则表达式。 **基本语法**: ```bash grep [选项] 模式 [文件...] ``` **常用选项**: - `-i`: 忽略大小写 - `-r` 或 `-R`: 递归搜索目录 - `-n`: 显示匹配行的行号 - `-v`: 反向匹配(显示不包含模式的行) - `-E`: 使用扩展正则表达式(等同于`egrep`) **使用场景**: 1. 在当前目录所有文件中搜索包含`error`的行(忽略大小写): ```bash grep -ri "error" . ``` 2. 查找`/etc/passwd`中不含`/bin/bash`的行(即非bash用户): ```bash grep -v "/bin/bash" /etc/passwd ``` 3. 使用正则表达式匹配IP地址(需要`-E`): ```bash echo "192.168.1.1" | grep -E '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' ``` **注意事项**: - 模式中若包含特殊字符(如`$`, `*`),需用单引号括起。 - 递归搜索时,`-r`和`-R`在大多数Linux发行版中行为相同,但在某些系统(如macOS)中`-R`会跟随符号链接。 ### 3. `sed` 命令 **简介**:流编辑器,用于对输入流(文件或管道)进行文本转换(如替换、删除、插入)。 **基本语法**: ```bash sed [选项] '指令' [输入文件] ``` **常用指令**: - `s/模式/替换/`: 替换匹配模式的文本(可加`g`表示全局替换) - `d`: 删除行 - `p`: 打印行(通常与`-n`选项配合使用) - `a\text`: 在行后追加文本 - `i\text`: 在行前插入文本 **使用场景**: 1. 替换文件中的字符串(原文件不变,输出到屏幕): ```bash sed 's/foo/bar/g' file.txt ``` 2. 直接修改文件(使用`-i`选项): ```bash sed -i 's/foo/bar/g' file.txt ``` 3. 删除空白行: ```bash sed '/^$/d' file.txt ``` **注意事项**: - `-i`选项会直接修改文件,建议先备份或测试无误后再使用。 - 指令中的分隔符`/`可替换为其他字符(如`s|foo|bar|g`),避免与模式中的`/`冲突。 ### 4. `awk` 命令 **简介**:强大的文本处理工具,按行处理,自动分割字段(默认空格分隔),支持编程结构(如条件、循环)。 **基本语法**: ```bash awk '模式 {动作}' [文件] ``` **常用变量**: - `$0`: 整行内容 - `$1`, `$2`, ...: 第1、2个字段 - `NF`: 当前行的字段数 - `NR`: 当前行号 - `FS`: 输入字段分隔符(默认为空格) - `OFS`: 输出字段分隔符(默认为空格) **使用场景**: 1. 打印文件每行的第一个字段(如`/etc/passwd`的用户名): ```bash awk -F: '{print $1}' /etc/passwd ``` 2. 统计文件行数: ```bash awk 'END {print NR}' file.txt ``` 3. 计算第1列数字之和: ```bash awk '{sum+=$1} END {print sum}' data.txt ``` **注意事项**: - 指定分隔符用`-F`(如`-F:`表示冒号分隔)。 - 引用变量时无需加`$`(如`NR`),而字段需要(如`$1`)。 ### 5. `man` 命令 **简介**:查看命令、函数或配置文件的手册页(manual pages)。 **基本语法**: ```bash man [章节] 名称 ``` **常用章节**: - 1: 用户命令 - 2: 系统调用 - 3: 库函数 - 5: 文件格式(如配置文件) - 8: 系统管理命令 **使用场景**: 1. 查看`ls`命令的用法: ```bash man ls ``` 2. 查看`open`系统调用的文档(需指定章节): ```bash man 2 open ``` **注意事项**: - 按`q`退出手册页。 - 若名称同时存在于多个章节(如`printf`命令和函数),可用`man 1 printf`和`man 3 printf`区分。 ### 6. `which` 命令 **简介**:定位命令的完整路径(在`$PATH`环境变量中查找)。 **基本语法**: ```bash which 命令名 ``` **使用场景**: 1. 查看`ls`命令的路径: ```bash which ls # 输出:/bin/ls ``` 2. 检查命令是否存在: ```bash which some_command > /dev/null && echo "存在" || echo "不存在" ``` **注意事项**: - 仅搜索`$PATH`中的目录,不会查找别名或内置命令(如`cd`)。 ### 7. `env` 命令 **简介**:查看当前环境变量,或设置临时环境运行程序。 **基本语法**: ```bash env [选项] [变量=值]... [命令] ``` **使用场景**: 1. 显示所有环境变量: ```bash env ``` 2. 临时修改环境变量运行程序(如设置`LANG`): ```bash env LANG=C date ``` 3. 清除所有环境变量后运行程序(`-i`选项): ```bash env -i /path/to/program ``` **注意事项**: - 临时设置的环境变量仅影响后续执行的命令,不影响当前shell环境。 ### 总结 以上命令是Linux系统管理、文本处理和日常使用的核心工具。熟练掌握它们能极大提高工作效率。注意不同系统(如BSD和GNU)的差异,如引用[1]所述,跨平台脚本需谨慎使用这些命令或考虑Python/Perl替代。 §§相关问题§§ 1. 如何组合使用`find`和`grep`进行复杂搜索? 2. `sed`和`awk`在文本处理中有哪些典型区别? 3. 如何通过`man`手册快速查找特定选项的说明? 4. 在脚本中如何安全地使用`find`的`-exec`选项? 5. `env`命令在脚本开发中的常见用途有哪些?</think>### Linux 常用命令详解 #### 1. `find`:文件搜索工具 **用途**:在目录树中递归搜索文件,支持按名称、类型、时间、权限等条件过滤 **基本语法**: ```bash find [路径] [表达式] ``` **常用场景**: - 按名称搜索:`find /home -name "*.txt"`(查找/home下所有txt文件)[^2] - 按类型搜索:`find . -type d`(查找当前目录所有子目录) - 按时间过滤:`find /var/log -mtime -7`(查找7天内修改的文件) - 结合执行操作:`find ~ -size +10M -exec rm {} \;`(删除大于10MB的文件) **注意**:BSD和GNU版本参数有差异,跨平台需谨慎[^1] --- #### 2. `grep`:文本搜索工具 **用途**:在文件或输入流中匹配正则表达式 **基本语法**: ```bash grep [选项] 模式 [文件] ``` **常用场景**: - 基础搜索:`grep "error" /var/log/syslog`(搜索包含error的行) - 递归搜索:`grep -r "TODO" src/`(递归搜索源码目录) - 显示行号:`grep -n "pattern" file`(显示匹配行号) - 反向过滤:`grep -v "#" config.conf`(过滤注释行) **特殊技巧**: ```bash ps aux | grep "[n]ginx" # 精确匹配进程(避免匹配grep自身) ``` --- #### 3. `sed`:流编辑器 **用途**:对文本流进行替换、删除、插入等操作 **基本语法**: ```bash sed [选项] '指令' 文件 ``` **核心操作**: | 指令 | 作用 | 示例 | |----------|--------------------------|-------------------------------| | `s/old/new/` | 替换文本 | `sed 's/foo/bar/g' file` | | `/pattern/d` | 删除匹配行 | `sed '/^#/d' config` | | `5i\text` | 在第5行前插入文本 | `sed '3i\# New Line' file` | **典型场景**: - 批量替换:`sed -i.bak 's/old/new/g' *.txt`(备份并替换) - 删除空行:`sed '/^$/d' input.txt > output.txt` --- #### 4. `awk`:文本处理语言 **用途**:字段提取、数据统计、报告生成 **基本语法**: ```bash awk '模式 {动作}' 文件 ``` **核心概念**: - `$0`:整行内容 - `$1, $2...`:第1、2个字段 - `NR`:行号,`NF`:字段数 **常用场景**: - 提取字段:`awk -F: '{print $1}' /etc/passwd`(输出用户名) - 条件过滤:`awk '$3 > 1000 {print $0}' data.csv`(过滤第三列大于1000的行) - 数据统计: ```bash awk '{sum+=$1} END {print "Average:", sum/NR}' numbers.txt ``` --- #### 5. `man`:手册查看 **用途**:查看命令/系统调用的文档 **基本语法**: ```bash man [章节] 命令名 ``` **手册章节**: 1. 用户命令 2. 系统调用 3. 库函数 **技巧**: - `man -k keyword`:搜索相关手册(如`man -k "socket"`) - 导航:空格翻页,`/pattern`搜索,`q`退出 --- #### 6. `which`:命令定位 **用途**:查找命令的绝对路径 **示例**: ```bash $ which python /usr/bin/python # 显示第一个匹配路径 ``` **注意**:仅搜索`$PATH`变量中的路径 --- #### 7. `env`:环境管理 **用途**:查看/设置环境变量,临时修改环境执行命令 **常用操作**: - 查看所有环境变量:`env` - 临时修改变量: ```bash env LANG=C python script.py # 临时使用C语言环境执行 ``` - 清空环境执行:`env -i command`(无继承环境) --- ### 命令组合实战 **场景**:统计nginx日志中404错误的IP分布 ```bash grep " 404 " access.log | awk '{print $1}' | sort | uniq -c | sort -nr ``` 1. `grep`过滤404错误 2. `awk`提取IP地址(第1列) 3. `sort`排序 4. `uniq -c`统计重复次数 5. `sort -nr`按次数倒序排列 --- ### 注意事项 1. BSD(如MacOS)与GNU命令存在差异,跨平台脚本建议测试或使用Python/Perl替代[^1] 2. 变量引用用`${var}`避免歧义(如`${var}_suffix`)[^3] 3. 脚本参数处理:`$0`脚本名,`$1`第一个参数,`$#`参数个数[^2]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值