这次该说tr命令了~
tr 是Unix命令行专家工具箱中一件简约却不失精美的工具。他经常用来编写优美的单行命令,作用不容小视。 tr 可以对来自标准输入的内容进行字符替换,字符删除以及重复字符压缩。他可以将一组字符变成另一组字符,因而通常也被称为转换命令,我们一起来看看它的基本用法。
(1):基本用法
tr 只能通过stdin(标准输入),而无法通过命令行参数来接受输入。它的调用格式如下:
$ tr [options] set1 set2
将来自stdin 的输入字符从set1 映射 set2, 然后将输出写入stdout(标准输出)。set1 和set2 是字符类或字符集。如果两个字符集的长度不相等,那么set2会不断重复其最后一个字符,直到长度与set1相同。 如果set2的长度大于set1,那么在set2中超过set1长度的那部分字符则全部被忽略。
来看个例子:
将输入字符由大写转换为小写,可以使用下面的命令:
$ echo " HELLO WHO IS THIS" | tr 'A-Z' 'a-z'
'A-Z' 和 ‘a-z’ 都是集合。我们可以按照需要追加字符或字符类来构造自己定制的集合。
定义集合也很简单,不需要书写一长串连续的字符序列,只需要使用"起始字符-终止字符"这种格式就行了。如果起始字符-终止字符不是一个连续的字符序列,那么他就会被视为包含了3个元素的集合,也就是:起始字符,-,终止字符。
通过在tr中使用集合的概念,我们可以轻松的将字符从一个集合映射到另一个集合中。下面通过一则示例看看如何用tr进行数字加密解密。
加密:
解密:
(2): 其他用法
a) 用tr删除字符
tr 有一个选项-d,可以通过制定需要删除的字符集合,将出现在stdin中的特定字符清除掉:
$ cat file.txt | tr -d '[set1]'
例如:
b) 字符集补集
我们可以利用选项-c使用set1的补集。下面的命令中 set2是可选的
tr -c [set1] [set2]
set1 的补集意味着这个集合中包含set1中没有的所有字符。
最典型的用法是从输入文本中将不在补集中的所有字符全部删除。例如:
在这里,补集中包含了数字,空格字符和换行符之外的字符。因为指定了-d,所以这些字符全部被删除。
c) 用tr压缩字符
tr命令在很多文本处理环境中有用武之地。多数情况下,连续的重复字符应该压缩成单个字符。经常需要从事的一项任务就是压缩空白字符。
tr的 -s 选项可以压缩输入中重复的字符,方法如下:
$ tr -s '[set]'
例:
(4): 字符类
tr 可以像使用集合一样使用各种不同的字符类,这些字符类如下所示:
alnum:字母和数字
alpha:字母
cntrl:控制(非打印)字符
digit:数字
graph:图形字符
lower:小写字母
print:可打印字符
punct: 标点字符
space:空白字符
upper: 大写字母
xdigit: 十六进制字符
可以按照下面的方式并会用所需的字符类
$ tr [:class:] ["class:]
例: