Unix 文本处理工具全解析
在 Unix 系统中,文本处理是一项基础且重要的工作。Unix 程序员倾向于处理文本行,因为文本数据比二进制数据更具灵活性,而且 Unix 系统提供了许多便于处理文本的工具。下面将详细介绍一些常用的文本处理工具及其使用方法。
文本搜索工具 grep
在 Unix 系统中,用于查找文本的主力程序是 grep。在 POSIX 系统上,grep 可以使用两种正则表达式风格,也可以匹配简单字符串。
过去,有三个独立的程序用于在文本文件中搜索:
- grep :原始的文本匹配程序,使用 POSIX 定义的基本正则表达式(BREs)。
- egrep :“扩展 grep”,使用扩展正则表达式(EREs),这是一种更强大的正则表达式表示法,但使用起来可能在计算上更昂贵。在现代系统中,这种差异已经很小。
- fgrep :“快速 grep”,使用针对固定字符串匹配优化的算法来匹配固定字符串,而不是正则表达式。原始版本是唯一可以并行匹配多个字符串的变体。
1992 年的 POSIX 标准将这三个变体合并为一个 grep 程序,其行为由不同的选项控制。2001 年的 POSIX 标准只包含合并后的 grep 命令,但实际上,egrep 和 fgrep 在所有 Unix 和类 Unix 系统上仍然可用。
grep 的使用方法 :
grep [ options ... ] pattern-spec [ files ...
超级会员免费看
订阅专栏 解锁全文
1700

被折叠的 条评论
为什么被折叠?



