Unix下要采用的20个好习惯为:
1)在单个命令中创建目录树。
2)更改路径;不要移动存档。
3)将命令与控制操作符组合使用。
4)谨慎引用变量。
5)使用转义序列来管理较长的输入。
6)在列表中对命令分组。
7)在find之外使用xargs。
8)了解何时grep应该执行计数——何时应该绕过。
9)匹配输出中的某些字段,而不只是对行进行匹配。
10)停止对cat使用管道。
11)使用文件名自动完成功能(file name completion)。
12)使用历史扩展。
13)重用以前的参数。
14)使用pushd
和popd
管理目录导航。
15)查找大型文件。
16)不使用编辑器创建临时文件。
17)使用curl
命令行实用工具。
18)最有效地利用正则表达式。
19)确定当前用户。
20)使用awk
处理数据。
1.在单个命令中创建目录树
清单1演示了最常见的UNIX坏习惯之一:一次定义一个目录树。
清单1.坏习惯1的示例:单独定义每个目录树
~ $ mkdir tmp
~ $ cd tmp
~/tmp $ mkdir a
~/tmp $ cd a
~/tmp/a $ mkdir b
~/tmp/a $ cd b
~/tmp/a/b/ $ mkdir c
~/tmp/a/b/ $ cd c
~/tmp/a/b/c $
使用mkdir的-p选项并在单个命令中创建所有父目录及其子目录要容易得多。但是即使对于知道此选项的管理员,他们在命令行上创建子目录时也仍然束缚于逐步创建每级子目录。花时间有意识地养成这个好习惯是值得的.
清单2.好习惯1的示例:使用一个命令来定义目录树
~ $ mkdir -p tmp/a/b/c
您可以使用此选项来创建整个复杂的目录树(在脚本中使用是非常理想的),而不只是创建简单的层次结构。
清单3.好习惯1的另一个示例:使用一个命令来定义复杂的目录树
~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
过去,单独定义目录的唯一借口是您的mkdir实现不支持此选项,但是在大多数系统上不再是这样了。IBM、AIX®、mkdir、GNU mkdir和其他遵守单一UNIX规范(Single UNIX Specification)的系统现在都具有此选项。
对于仍然缺乏该功能的少数系统,您可以使用mkdirhier脚本(请参见参考资料),此脚本是执行相同功能的mkdir的包装:
~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
2.更改路径;不要移动存档
另一个不良的使用模式是将.tar存档文件移动到某个目录,因为该目录恰好是您希望在其中提取.tar文件的目录。其实您根本不需要这样做。您可以随心所欲地将任何.tar存档文件解压缩到任何目录——这就是-C选项的用途。在解压缩某个存档文件时,使用-C选项来指定要在其中解压缩该文件的目录:
清单4.好习惯2的示例:使用选项-C来解压缩.tar存档文件
~ $ tar xvf -C tmp/a/b/c newarc.tar.gz
相对于将存档文件移动到您希望在其中解压缩它的位置,切换到该目录,然后才解压缩它,养成使用-C的习惯则更加可取——当存档文件位于其他某个位置时尤其如此。
3.将命令与控制操作符组合使用
您可能已经知道,在大多数Shell中,您可以在单个命令行上通过在命令之间放置一个分号(;)来组合命令。该分号是Shell控制操作符,虽然它对于在单个命令行上将离散的命令串联起来很有用,但它并不适用于所有情况。例如,假设您使用分号来组合两个命令,其中第二个命令的正确执行完全依赖于第一个命令的成功完成。如果第一个命令未按您预期的那样退出,第二个命令仍然会运行——结果会导致失败。相反,应该使用更适当的控制操作符(本文将描述其中的部分操作符)。只要您的Shell支持它们,就值得养成使用它们的习惯。
3.1仅当另一个命令返回零退出状态时才运行某个命令
使用&&控制操作符来组合两个命令,以便仅当第一个命令返回零退出状态时才运行第二个命令。换句话说,如果第一个命令运行成功,则第二个命令将运行。如果第一个命令失败,则第二个命令根本就不运行。例如:
清单5.好习惯3的示例:将命令与控制操作符组合使用
~ $ cd tmp/a/b/c && tar xvf ~/archive.tar
在此例中,存档的内容将提取到~/tmp/a/b/c目录中,除非该目录不存在。如果该目录不存在,则tar命令不会运行,因此不会提取任何内容。
3.2仅当另一个命令返回非零退出状态时才运行某个命令
类似地,||控制操作符分隔两个命令,并且仅当第一个命令返回非零退出状态时才运行第二个命令。换句话说,如果第一个命令成功,则第二个命令不会运行。如果第一个命令失败,则第二个命令才会运行。在测试某个给定目录是否存在时,通常使用此操作符,如果该目录不存在,则创建它:
清单6.好习惯3的另一个示例:将命令与控制操作符组合使用
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c
您还可以组合使用本部分中描述的控制操作符。每个操作符都影响最后的命令运行:
清单7.好习惯3的组合示例:将命令与控制操作符组合使用
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar
4.谨慎引用变量
始终要谨慎使用Shell扩展和变量名称。一般最好将变量调用包括在双引号中,除非您有不这样做的足够理由。类似地,如果您直接在字母数字文本后面使用变量名称,则还要确保将该变量名称包括在方括号([])中,以使其与周围的文本区分开来。否则,Shell将把尾随文本解释为变量名称的一部分——并且很可能返回一个空值。清单8提供了变量的各种引用和非引用及其影响的示例。
清单8.好习惯4的示例:引用(和非引用)变量
~ $ ls tmp/
a b
~ $ VAR=”tmp/*”
~ $ echo $VAR
tmp/a tmp/b
~ $ echo “$VAR”
tmp/*
~ $ echo $VARa
~ $ echo “$VARa”
~ $ echo “${VAR}a”
tmp/*a
~ $ echo ${VAR}a
tmp/a
~ $
5.使用转义序列来管理较长的输入
您或许看到过使用反斜杠(\)来将较长的行延续到下一行的代码示例,并且您知道大多数Shell都将您通过反斜杠联接的后续行上键入的内容视为单个长行。然而,您可能没有在命令行中像通常那样利用此功能。如果您的终端无法正确处理多行回绕,或者您的命令行比通常小(例如在提示符下有长路经的时候),反斜杠就特别有用。反斜杠对于了解键入的长输入行的含义也非常有用,如以下示例所示:
清单9.好习惯5的示例:将反斜杠用于长输入
~ $ cd tmp/a/b/c || \
> mkdir -p tmp/a/b/c && \
> tar xvf -C tmp/a/b/c ~/archive.tar
或者,也可以使用以下配置:
清单10.好习惯5的替代示例:将反斜杠用于长输入
~ $ cd tmp/a/b/c \
>|| \
> mkdir -p tmp/a/b/c \
>&& \
> tar xvf -C tmp/a/b/c ~/archive.tar
然而,当您将输入行划分到多行上时,Shell始终将其视为单个连续的行,因为它总是删除所有反斜杠和额外的空格。
注意:在大多数Shell中,当您按向上箭头键时,整个多行输入将重绘到单个长输入行上。
6.在列表中对命令分组
大多数Shell都具有在列表中对命令分组的方法,以便您能将它们的合计输出向下传递到某个管道,或者将其任何部分或全部流重定向到相同的地方。您一般可以通过在某个Subshell中运行一个命令列表或通过在当前Shell中运行一个命令列表来实现此目的。
6.1在Subshell中运行命令列表
使用括号将命令列表包括在单个组中。这样做将在一个新的Subshell中运行命令,并允许您重定向或收集整组命令的输出,如以下示例所示:
清单11.好习惯6的示例:在Subshell中运行命令列表
~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \
> VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \
> | mailx admin -S “Archive contents”
在此示例中,该存档的内容将提取到tmp/a/b/c/目录中,同时将分组命令的输出(包括所提取文件的列表)通过邮件发送到地址admin。
当您在命令列表中重新定义环境变量,并且您不希望将那些定义应用于当前Shell时,使用Subshell更可取。
6.2在当前Shell中运行命令列表
将命令列表用大括号({})括起来,以在当前Shell中运行。确保在括号与实际命令之间包括空格,否则Shell可能无法正确解释括号。此外,还要确保列表中的最后一个命令以分号结尾,如以下示例所示:
清单12.好习惯6的另一个示例:在当前Shell中运行命令列表
~ $ { cp ${VAR}a . && chown -R guest.guest a && \
> tar cvf newarchive.tar a; } | mailx admin -S “New archive”
7.在find之外使用xargs
使用xargs工具作为筛选器,以充分利用从find命令挑选的输出。find运行通常提供与某些条件匹配的文件列表。此列表被传递到xargs上,后者然后使用该文件列表作为参数来运行其他某些有用的命令,如以下示例所示:
清单13. xargs工具的经典用法示例
~ $ find some-file-criteria some-file-path | \
> xargs some-great-command-that-needs-filename-arguments
然而,不要将xargs仅看作是find的辅助工具;它是一个未得到充分利用的工具之一,当您养成使用它的习惯时,将会希望进行所有试验,包括以下用法。
7.1传递空格分隔的列表
在最简单的调用形式中,xargs就像一个筛选器,它接受一个列表(每个成员分别在单独的行上)作为输入。该工具将那些成员放置在单个空格分隔的行上:
清单14. xargs工具产生的输出示例
~ $ xargs
a
b
c
Control-D
a b c
~ $
您可以发送通过xargs来输出文件名的任何工具的输出,以便为其他某些接受文件名作为参数的工具获得参数列表,如以下示例所示:
清单15. xargs工具的使用示例
~/tmp $ ls -1 | xargs
December_Report.pdf README a archive.tar mkdirhier.sh
~/tmp $ ls -1 | xargs file
December_Report.pdf: PDF document, version 1.3
README: ASCII text
a: directory
archive.tar: POSIX tar archive
mkdirhier.sh: Bourne shell script text executable
~/tmp $
xargs命令不只用于传递文件名。您还可以在需要将文本筛选到单个行中的任何时候使用它:
清单16.好习惯7的示例:使用xargs工具来将文本筛选到单个行中
~/tmp $ ls -l | xargs
-rw-r–r– 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r–r– 1 \
root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \
16:07 a -rw-r–r– 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \
joe joe 3239 Sep 30 12:40 mkdirhier.sh
~/tmp $
7.2谨慎使用xargs
从技术上讲,使用xargs很少遇到麻烦。缺省情况下,文件结束字符串是下划线(_);如果将该字符作为单个输入参数来发送,则它之后的所有内容将被忽略。为了防止这种情况发生,可以使用-e标志,它在不带参数的情况下完全禁用结束字符串。
8.了解何时grep应该执行计数——何时应该绕过
避免通过管道将grep发送到wc -l来对输出行数计数。grep的-c选项提供了对与特定模式匹配的行的计数,并且一般要比通过管道发送到wc更快,如以下示例所示:
清单17.好习惯8的示例:使用和不使用grep的行计数
~ $ time grep and tmp/a/longfile.txt | wc -l
2811
real0m0.097s
user0m0.006s
sys0m0.032s
~ $ time grep -c and tmp/a/longfile.txt
2811
real0m0.013s
user0m0.006s
sys0m0.005s
~ $
除了速度因素外,-c选项还是执行计数的好方法。对于多个文件,带-c选项的grep返回每个文件的单独计数,每行一个计数,而针对wc的管道则提供所有文件的组合总计数。
然而,不管是否考虑速度,此示例都表明了另一个要避免地常见错误。这些计数方法仅提供包含匹配模式的行数——如果那就是您要查找的结果,这没什么问题。但是在行中具有某个特定模式的多个实例的情况下,这些方法无法为您提供实际匹配实例数量的真实计数。归根结底,若要对实例计数,您还是要使用wc来计数。首先,使用-o选项(如果您的版本支持它的话)来运行grep命令。此选项仅输出匹配的模式,每行一个模式,而不输出行本身。但是您不能将它与-c选项结合使用,因此要使用wc -l来对行计数,如以下示例所示:
清单18.好习惯8的示例:使用grep对模式实例计数
~ $ grep -o and tmp/a/longfile.txt | wc -l
3402
~ $
在此例中,调用wc要比第二次调用grep并插入一个虚拟模式(例如grep -c)来对行进行匹配和计数稍快一点。
9.匹配输出中的某些字段,而不只是对行进行匹配
当您只希望匹配输出行中特定字段中的模式时,诸如awk等工具要优于grep。
下面经过简化的示例演示了如何仅列出12月修改过的文件。
清单19.坏习惯9的示例:使用grep来查找特定字段中的模式
~/tmp $ ls -l /tmp/a/b/c | grep Dec
-rw-r–r–7 joe joe12043 Jan 27 20:36 December_Report.pdf
-rw-r–r–1 root root238 Dec 03 08:19 README
-rw-r–r–3 joe joe5096 Dec 14 14:26 archive.tar
~/tmp $
在此示例中,grep对行进行筛选,并输出其修改日期和名称中带Dec的所有文件。因此,诸如December_Report.pdf等文件是匹配的,即使它自从一月份以来还未修改过。这可能不是您希望的结果。为了匹配特定字段中的模式,最好使用awk,其中的一个关系运算符对确切的字段进行匹配,如以下示例所示:
清单20.好习惯9的示例:使用awk来查找特定字段中的模式
~/tmp $ ls -l | awk ‘$6 == “Dec”‘
-rw-r–r–3 joe joe5096 Dec 14 14:26 archive.tar
-rw-r–r–1 root root238 Dec 03 08:19 README
~/tmp $
10.停止对cat使用管道
grep的一个常见的基本用法错误是通过管道将cat的输出发送到grep以搜索单个文件的内容。这绝对是不必要的,纯粹是浪费时间,因为诸如grep这样的工具接受文件名作为参数。您根本不需要在这种情况下使用cat,如以下示例所示:
清单21.好习惯和坏习惯10的示例:使用带和不带cat的grep
~ $ time cat tmp/a/longfile.txt | grep and
2811
real0m0.015s
user0m0.003s
sys0m0.013s
~ $ time grep and tmp/a/longfile.txt
2811
real0m0.010s
user0m0.006s
sys0m0.004s
~ $
此错误存在于许多工具中。由于大多数工具都接受使用连字符(-)的标准输入作为一个参数,因此即使使用cat来分散stdin中的多个文件,参数也通常是无效的。仅当您使用带多个筛选选项之一的cat时,才真正有必要在管道前首先执行连接。
11.使用文件名完成
如果不需要在命令提示符处键入长的、令人费解的文件名,这是不是很棒呢?的确,您不需要这样做。相反,您可以配置最流行的UNIX Shell以使用文件名完成。该功能在各个Shell中的工作方式略有不同,因此我将向您展示如何在最流行的Shell中使用文件名完成。文件名完成使您可以更快地输入并避免错误。懒惰?也许吧。效率更高?当然!
常用首字母缩写词
1)MB:兆字节
2)HTTP:超文本传输协议
3)HTTPS:HTTP over Secure Sockets Layer
4)FTP:文件传输协议
5)FTPS:FTP over Secure Sockets Layer
6)LDAP:轻型目录访问协议
我正在运行哪种Shell?
如果您不知道目前使用的是哪一种Shell,会怎么样?虽然这个诀窍不是另外10个好习惯的正式组成部分,但它仍然很有用。可以使用echo $0或ps -p $$命令显示您正在使用的Shell。对于我来说,运行的是Bash Shell。
清单1.确定您的Shell
$ echo $0
-bash
$ ps –p $$
PID TTYTIME CMD
6344 ttys0000:00.02 –bash
C Shell
C Shell支持最直接文件名完成功能。设置filec变量可启用该功能。(您可以使用命令set filec。)在您开始键入文件名后,可以按Esc键,Shell将完成文件名,或完成尽可能多的部分。例如,假设您拥有名为file1、file2和file3的文件。如果您键入f,然后按Esc键,将填充file,而您必须键入1、2或3来完成相应的文件名。
Bash
Bash Shell也提供了文件名完成,但使用Tab键代替Esc键。您在Bash Shell中不需要设置任何选项即可启用文件名完成,该选项是缺省设置的。Bash还实现了其他功能。键入文件名的一部分后,按Tab键,如果有多个文件满足您的请求,并且您需要添加文本以选择其中一个文件,那么您可以多按Tab键两次,以显示与您目前键入的内容相匹配的文件的列表。使用之前名为file1、file2和file3的文件示例,首先键入f。当您按一次Tab键时,Bash完成file;再按一次Tab键时,将展开列表file1 file2 file3。
Korn Shell
对于Korn Shell用户,文件名完成取决于EDITOR变量的值。如果EDITOR设置为vi,那么您键入部分名称,然后按Esc键,后跟反斜杠(\)字符。如果EDITOR设置为emacs,那么您键入部分名称,然后按两次Esc键以完成文件名。
12.使用历史扩展
如果您为一系列命令使用相同的文件名,会发生什么情况?当然,有一种快捷方式可以快速获得您上次使用的文件名。如清单2所示,!$命令返回前一个命令使用的文件名。从文件this-is-a-long-lunch-menu-file.txt中搜索单词pickles的出现位置。搜索结束后,使用vi命令来编辑this-is-a-long-lunch-menu-file.txt文件,而不需要重新键入文件名。您使用感叹号(!)来访问历史,然后使用美元符号($)返回前一命令的最后字段。如果您反复用到长文件名,那么这是一个非常好的工具。
清单2.使用!$获得前一个命令使用的文件名
$ grep pickles this-is-a-long-lunch-menu-file.txt
pastrami on rye with pickles and onions
$ vi !$
13.重用以前的参数
!$命令返回某个命令使用的上一个文件名参数。但如果某个命令使用多个文件名,而您只希望重用其中一个文件名,该如何做?!:1操作符返回某个命令使用的第一个文件名。清单3中的示例显示可以如何将此操作符与!$运算符组合使用。在第一个命令中,将一个文件重新命名为更有意义的名称,但为了保持原始文件名可用,创建了一个符号链接。重新命名文件kxp12.c以提高可读性,然后使用link命令来创建到原始文件名的符号链接,以防在其他位置使用该文件名。!$操作符返回file_system_access.c文件名,而!:1操作符返回kxp12.c文件名,该文件名是上个命令的第一个文件名。
清单3.组合使用!$和!:1
$ mv kxp12.c file_system_access.c
$ ln –s !$ !:1
14.使用pushd和popd管理目录导航
UNIX支持各种目录导航工具。最喜欢的两款提高工作效率的工具是pushd和popd。您当然了解cd命令用于更改您的当前目录。如果您要在多个目录中导航,但希望能够快速返回某个位置,该如何做?pushd和popd命令创建一个虚拟目录堆栈,pushd命令用来更改您的当前目录并将其存储在堆栈中,而popd命令用来从堆栈的顶部移除目录并使您返回该位置。您可以使用dirs命令来显示当前目录堆栈,而不会压入或弹出新目录。清单4显示如何使用pushd和popd命令在目录树中快速导航。
清单4.使用pushd和popd在目录树中导航
$ pushd .
~ ~
$ pushd /etc
/etc ~ ~
$ pushd /var
/var /etc ~ ~
$ pushd /usr/local/bin
/usr/local/bin /var /etc ~ ~
$ dirs
/usr/local/bin /var /etc ~ ~
$ popd
/var /etc ~ ~
$ popd
/etc ~ ~
$ popd
~ ~
$ popd
pushd和popd命令还支持使用参数处理目录堆栈。使用+n或-n参数,其中n是一个数字,您可以向左或向右移动堆栈,如清单5所示。
清单5.旋转目录堆栈
$ dirs
/usr/local/bin /var /etc ~ ~
$ pushd +1
/var /etc ~ ~ /usr/local/bin
$ pushd -1
~ /usr/local/bin /var /etc ~
15.查找大型文件
是否需要找出您的所有空闲磁盘空间被什么占用了?您可以使用以下几个工具来管理您的存储设备。如清单6所示,df命令为您显示每个可用卷上已使用的块的总数,以及空闲空间的百分比。
清单6.确定卷的使用情况
$ df
Filesystem512-blocksUsedAvailable CapacityMounted on
/dev/disk0s2311909984 2672752644412272086%/
devfs2242240100%/dev
fdesc220100%/dev
map -hosts000100%/net
map auto_home000100%/home
是否希望查找大型文件?使用find命令时附带-size参数。清单7显示了如何使用find命令来查找大于10MB的文件。请注意,-size参数以KB为单位计量大小。
清单7.查找大于10MB的所有文件
$ find / -size +10000k –xdev –exec ls –lh {}\;
16.不使用编辑器创建临时文件
以下是一个简单示例:您需要快速创建一个简单临时文件,但不希望启动您的编辑器。使用带有>文件重定向操作符的cat命令。如清单8所示,使用不带文件名的cat命令只回显向标准输入键入的任何内容;>重定向将该输入捕获到指定的文件中。请注意,您在结束键入时必须提供文件结束字符,通常为Ctrl-D。
清单8.快速创建临时文件
$ cat > my_temp_file.txt
This is my temp file text
^D
$ cat my_temp_file.txt
This is my temp file text
需要执行相同操作,但是附加到现有文件而不是创建新文件。如清单9所示,改用>>操作符。>>文件重定向操作符向现有文件附加内容。
清单9.快速向文件附加内容
$ cat >> my_temp_file.txt
More text
^D
$ cat my_temp_file.txt
This is my temp file text
More text
17.使用curl命令行实用工具
curl命令使您可以使用HTTP、HTTPS、FTP、FTPS、Gopher、DICT、TELNET、LDAP或FILE协议从服务器检索数据。如清单10所示,我可以使用curl命令从美国国家气象局了解我所在位置(纽约州布法罗市)的当前天气状况。当与grep命令组合使用时,我可以检索布法罗市的天气状况。使用-s命令行选项来禁止curl处理输出。
清单10.使用curl检索当前天气状况
$ curl –s http://www.srh.noaa.gov/data/ALY/RWRALY | grep BUFFALO
BUFFALOMOSUNNY432243 NE1330.10R
如清单11所示,您也可以使用curl命令来下载HTTP托管的文件。使用-o参数来指定保存输出的位置。
清单11.使用curl下载HTTP承载的文件
$ curl -o archive.tar http://www.somesite.com/archive.tar
这实际上只是您使用curl命令可以完成的操作的提示。您只需在命令提示符处键入man curl显示curl命令的完整使用信息,就可以开始了解更多内容。
18.最有效地利用正则表达式
大量UNIX命令使用正则表达式作为参数。从技术角度而言,正则表达式是表示某种模式的字符串(也就是说,由字母、数字和符号组成的字符序列),用于定义零或更长的字符串。正则表达式使用元字符(例如,星号[*]和问号[?])来匹配其他字符串的部分或全部内容。正则表达式不一定包含通配符,但通配符可以使正则表达式在搜索模式和处理文件时发挥更大的作用。表1显示了一些基本正则表达式序列。
表1.正则表达式序列
序列 | 说明 |
脱字符(^ ) | 匹配出现在行首的表达式,例如^A |
美元符号($ ) | 匹配出现在行末的表达式,例如A$ |
反斜杠(\ ) | 取消下一个字符的特殊含义,例如\^ |
方括号([] ) | 匹配括起来的任一字符,例如[aeiou] (使用连字符[- ]表示范围,例如[0-9] )。 |
[^ ] | 匹配除括起来字符以外的任一字符,例如[^0-9] |
句点(. ) | 匹配除行尾之外的任意单个字符 |
星号(* ) | 匹配零个或多个前驱字符或表达式 |
\{x,y\} | 匹配出现过x到y个和前面相同的内容 |
\{x\} | 精确匹配出现过x个和前面相同的内容 |
\{x,\} | 匹配出现过x个或更多和前面相同的内容 |
清单12显示了与grep命令一起使用的一些基本正则表达式。
清单12.使用正则表达式和grep
$ # Lists your mail
$ grep ‘^From: ‘ /usr/mail/$USER
$ # Any line with at least one letter
$ grep ‘[a-zA-Z]‘search-file.txt
$ # Anything not a letter or number
$ grep ‘[^a-zA-Z0-9] search-file.txt
$ # Find phone numbers in the form 999-9999
$ grep ‘[0-9]\{3\}-[0-9]\{4\}’ search-file.txt
$ # Find lines with exactly one character
$ grep ‘^.$’ search-file.txt
$ #Find any line that starts with a period “.”
$ grep ‘^\.’ search-file.txt
$ # Find lines thatstart with a “.” and 2 lowercase letters
$ grep ‘^\.[a-z][a-z]‘ search-file.txt
有关命令行正则表达式的深入描述,阅读developerWorks文章“对话UNIX,第9部分:正则表达式。”
19.确定当前用户
有时,您可能希望确定某个特定用户是否运行过您的管理脚本。为找出答案,您可以使用whoami命令来返回当前用户的名称。清单13显示了独自运行的whoami命令;清单14显示了使用whoami确保当前用户不是根用户的Bash脚本的摘录。
清单13.从命令行使用whoami
$ whoami
John
清单14.在脚本中使用whoami
if [ $(whoami) = "root" ]
then
echo “You cannot run this script as root.”
exit 1
fi
20.使用awk处理数据
awk命令似乎始终处在Perl的阴影下,但它对于简单、基于命令行的数据处理来说是一个快速、实用的工具。清单15显示了如何开始使用awk命令。若要获取文件中每行文本的长度,请使用length()函数。若要查看字符串ing是否出现在文件文本中,请使用index()函数,该函数返回ing首次出现的位置,这样您就可以使用它来进行进一步的字符串处理。若要tokenize(也就是说,将一行拆分为单词长度的片段)某个字符串,请使用split()函数。
清单15.基本awk处理
$ cat text
testing the awk command
$ awk ‘{ i = length($0); print i }’ text
23
$ awk ‘{ i = index($0,”ing”); print i}’ text
5
$ awk ‘BEGIN { i = 1 } { n = split($0,a,” “); while (i <= n) {print a[i]; i++;} }’ text
testing
the
awk
command
打印文本文件中的指定字段是一项简单的awk任务。在清单16中,sales文件包含每个销售人员的姓名,后跟每月销售数字。您可以使用awk命令来快速获得每个月的销售总额。缺省情况下,awk将每个以逗号分隔的值视为不同的字段。您使用$n操作符来访问每个字段。
清单16.使用awk对数据进行汇总
$cat sales
Gene,12,23,7
Dawn,10,25,15
Renee,15,13,18
David,8,21,17
$ awk -F, ‘{print $1,$2+$3+$4}’ sales
Gene 42
Dawn 50
Renee 46
David 46
成为命令行高手需要进行一些实践。按照相同的方式处理问题很简单,因为您已经习惯了。扩展您的命令行资源可以显著提高您的工作效率,并促使您朝着UNIX命令行高手的方向前进!
From:
http://www.ibm.com/developerworks/cn/aix/library/au-badunixhabits.html
https://www.ibm.com/developerworks/cn/aix/library/au-unixtips/