正则表达式常见元字符与特性详解
正则表达式在文本处理和模式匹配中扮演着至关重要的角色。本文将详细介绍正则表达式的一些常见元字符和特性,包括单词边界、前后瞻断言、注释与模式修饰符、分组与捕获等内容。
1. 单词边界相关
单词边界锚点用于匹配字符串中的特定位置,主要有两种不同的处理方式:
- 一种是为单词的起始和结束边界分别提供元序列,常见的如 \< 和 \> 。
- 另一种是提供一个通用的单词边界元序列,通常是 \b ,同时一般也会有对应的非单词边界元序列,如 \B 。
不同工具对单词边界的处理有所不同,具体如下表所示:
| 程序 | 单词起始…单词结束 | 单词边界 | 非单词边界 |
| — | — | — | — |
| GNU awk | \< ... \> | \y | \B |
| GNU egrep | \< ... \> | \b | \B |
| GNU Emacs | \< ... \> | \b | \B |
| Java | (?<!\pL)(?=\pL) ... (?<=\pL)(?!\pL) |
超级会员免费看
订阅专栏 解锁全文
1072

被折叠的 条评论
为什么被折叠?



