20121112grep正则表达式的使用

本文详细介绍了grep命令及其正则表达式的使用方法,包括基本的元字符集、锚定行开始与结束、字符范围匹配等功能,帮助读者掌握文本搜索技巧。

grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgrep。

  1. grep正则表达式元字符集(基本集):

^
  锚定行的开始
  如:’^test_str’匹配所有以test_str开头的行。

**∗∗  锚定行的结束  如:′teststr**   锚定行的结束   如:'test_str    teststr'匹配所有以test_str结尾的行。

.
  匹配一个非换行符的字符
   如:'test_.tr’匹配test_后接一个任意字符,然后是tr。

*****
  匹配零个或多个先前字符
   如:’ test_str’ (注意前有空格)匹配所有一个或多个空格后紧跟test_str的行。
   .*一起用代表任意字符。

[]
  匹配一个指定范围内的字符,
   如’[Tt]est_str’匹配Test_str和test_str。

[^]
  匹配一个不在指定范围内的字符,
   如:’[^A-FH-Z]rep’匹配不包含A-F和H-Z的一个字母开头,紧跟rep的行。

(…)
  标记匹配字符,
   如’(love)’,love被标记为1。

<
  锚定单词的开始,如:’<test_str’匹配包含以test_str开头的单词的行。

>
  锚定单词的结束,如’test_str>'匹配包含以test_str结尾的单词的行。

x{m}
  重复字符x,m次,如:'o{5}'匹配包含5个o的行。

x{m,}
  重复字符x,至少m次,如:'o{5,}'匹配至少有5个o的行。

x{m,n}
  重复字符x,至少m次,不多于n次,如:'o{5,10}'匹配5–10个o的行。

\w
  匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p’匹配以G后跟零个或多个文字或数字字符,然后是p。

\W
  \w的反置形式,匹配一个或多个非单词字符,如点号句号等。

\b
  单词锁定符,如: '\bgrep\b’只匹配grep。

基于模拟退火的计算器 在线运行 访问run.bcjh.xyz。 先展示下效果 https://pan.quark.cn/s/cc95c98c3760 参见此仓库。 使用方法(本地安装包) 前往Releases · hjenryin/BCJH-Metropolis下载最新 ,解压后输入游戏内校验码即可使用。 配置厨具 已在2.0.0弃用。 直接使用白菜菊花代码,保留高级厨具,新手池厨具可变。 更改迭代次数 如有需要,可以更改 中39行的数字来设置迭代次数。 本地编译 如果在windows平台,需要使用MSBuild编译,并将 改为ANSI编码。 如有条件,强烈建议这种本地运行(运行可加速、可多次重复)。 在 下运行 ,是游戏中的白菜菊花校验码。 编译、运行: - 在根目录新建 文件夹并 至build - - 使用 (linux) 或 (windows) 运行。 最后在命令行就可以得到输出结果了! (注意顺序)(得到厨师-技法,表示对应新手池厨具) 注:linux下不支持多任务选择 云端编译已在2.0.0弃用。 局限性 已知的问题: - 无法得到最优解! 只能得到一个比较好的解,有助于开阔思路。 - 无法选择菜品数量(默认拉满)。 可能有一定门槛。 (这可能有助于防止这类辅助工具的滥用导致分数膨胀? )(你问我为什么不用其他语言写? python一个晚上就写好了,结果因为有涉及json读写很多类型没法推断,jit用不了,算这个太慢了,所以就用c++写了) 工作原理 采用两层模拟退火来最大化总能量。 第一层为三个厨师,其能量用第二层模拟退火来估计。 也就是说,这套方法理论上也能算厨神(只要能够在非常快的时间内,算出一个厨神面板的得分),但是加上厨神的食材限制工作量有点大……以后再说吧。 (...
### grep 正则表达式使用方法 `grep` 是 Linux 系统中用于文本搜索的强大工具,其核心功能依赖于正则表达式使用。在不同的正则表达式标准下,`grep` 的行为会有所不同,尤其是在某些元字符的使用上,例如 `+` 和中括号 `[]` 的处理方式。 #### 基础正则表达式(BRE)与扩展正则表达式(ERE) `grep` 默认使用的是基础正则表达式(Basic Regular Expressions,BRE)标准。在此模式下,部分元字符如 `+`、`?` 和 `|` 被视为普通字符,若要将其作为正则运算符使用,则需要进行转义,例如 `\+`、`\?` 和 `\|`。这种设计是为了保持与早期版本的兼容性[^1]。 若希望直接使用 `+` 表示“一个或多个前导字符”的含义,可以启用扩展正则表达式(Extended Regular Expressions,ERE)模式,通常通过 `-E` 选项实现: ```bash grep -E "go+gle" file.txt ``` 该命令将匹配包含“google”、“gooogle”等字符串的行。 #### 中括号 `[]` 的使用 中括号用于定义字符类,表示匹配其中任意一个字符。在 BRE 和 ERE 中,`[]` 都被直接识别为正则表达式的一部分,无需额外转义。例如,以下命令将匹配包含数字字符的行: ```bash grep "[0-9]" file.txt ``` 而如果希望匹配非数字字符,则可以使用 `[^0-9]` 表达式: ```bash grep "[^0-9]" file.txt ``` #### `+` 符号的特殊处理 由于 `+` 在 BRE 中默认不具有特殊含义,因此必须使用 `\+` 才能表示“一个或多个前导字符”。例如,以下命令使用 BRE 模式匹配包含连续多个字母 `o` 的字符串: ```bash grep "go\+gle" file.txt ``` 若使用 `-E` 选项,则可以直接写为 `go+gle`,无需转义 `+`。 #### 示例 以下是一些常见的 `grep` 正则表达式用法示例: 1. 匹配以字母 `a` 开头的行: ```bash grep "^a" file.txt ``` 2. 匹配包含连续两个数字的行: ```bash grep "[0-9][0-9]" file.txt ``` 3. 匹配包含 `http://` 或 `https://` 的行: ```bash grep "https\?://" file.txt ``` 4. 使用扩展正则表达式匹配包含 `cat` 或 `dog` 的行: ```bash grep -E "cat|dog" file.txt ``` #### 注意事项 - 若未使用 `-E`,则需对 `+`、`?` 和 `|` 进行转义。 - 中括号 `[]` 可直接用于定义字符类,无需转义。 - `grep` 的行为受当前正则表达式标准影响,建议根据需求选择合适的模式。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值