Unix 文本处理的奇妙之旅
1. 文本过滤示例
在文本处理中,我们常常需要对不同编码的文本进行转换。比如,对于丹麦语的文本,在 ISO 8859 - 1 编码下,我们可以使用特定的过滤器进行转换。以下是一个示例:
$ cat danish
Show sample Danish text in ISO 8859-1 encoding
Øen med åen lå i læ af én halvø,
og én stor ø, langs den græske kyst.
$ iso8859-1-to-html danish
Convert text to HTML entities
Øen med åen lå i læ af én halvø,
og én stor ø, langs den græske kyst.
这个示例展示了如何将 ISO 8859 - 1 编码的丹麦语文本转换为 HTML 实体。
2. 破解单词谜题
在玩填字游戏时,我们有时会遇到难题,比如想不出一个以 b 开头,且第七个位置是 x 或 z 的十个字母的单词。这时,使用 awk 或 grep 进行正则表达式模式匹配是个不错的选择。
2.1 搜索文件选择
在 Unix 系统中,有一个很好的搜索文件选择,即 Unix 拼写字典,在许多系统中路径为
超级会员免费看
订阅专栏 解锁全文
975

被折叠的 条评论
为什么被折叠?



