正则表达式与文本处理全解析
1. 正则表达式基础
1.1 更改系统区域设置
若要让系统采用传统 Unix 行为,可将 LANG 变量设为 POSIX ,示例如下:
[me@linuxbox ~]$ export LANG=POSIX
需注意,此更改会使系统字符集采用美国英语(具体为 ASCII),所以要确保这是你想要的设置。若想让此更改永久生效,可把 export LANG=POSIX 这行代码添加到 .bashrc 文件中。
1.2 POSIX 基本与扩展正则表达式
POSIX 将正则表达式实现分为基本正则表达式(BRE)和扩展正则表达式(ERE)两类。此前介绍的功能,任何符合 POSIX 标准且实现 BRE 的应用程序都支持,像 grep 程序就是其中之一。
BRE 和 ERE 的区别在于元字符。BRE 能识别的元字符如下:
^ $ . [ ] *
其他字符都被视为普通字符。而 ERE 新增了以下元字符及其相关功能:
( ) { } ? + |
不过,在 BRE 中,若 ( ,
超级会员免费看
订阅专栏 解锁全文
1414

被折叠的 条评论
为什么被折叠?



