文本处理工具:sort、tr、uniq 和 wc 的实用指南
1. sort 命令的使用
1.1 按特定字段排序
sort 命令可以根据指定的字段和字符位置进行排序。例如, sort -k 4.10,4.13n 表示以第四字段的第 10 到 13 个字符(年份)作为主要排序字段,并按数字顺序排序。 -k 4.6,4.8M 则表示将第四字段的第 6 到 8 个字符(月份)视为三个字母的月份缩写进行排序。以下是一个具体的示例:
grep art=928 * | sort -k 4.10,4.13n -k 4.6,4.8M -k 4.3,4.4n -k 4.15,4.16n -k 4.18,4.19n -k 4.21,4.22n
这个命令会从所有文件中筛选出包含 art=928 的行,并按日期和时间进行排序。
1.2 字符计数技巧
为了准确确定字段中的字符位置,可以使用 echo 命令在文本样本的上方或下方输出数字行,避免手动计数时的不便。示例如下:
echo " [02/Mar/2011:16:30:34 -0800]" ; echo "123456789012345678901234567890"
1.3 处理人类可读的数字
现代工具通常以人类可读的形式显示文件大小,如
超级会员免费看
订阅专栏 解锁全文
3

被折叠的 条评论
为什么被折叠?



