11、Unix 文本处理与打印工具全解析

Unix 文本处理与打印工具全解析

1. 排序与去重

1.1 排序稳定性

在处理数据时,排序是常见操作。不过,普通的 sort 命令可能不稳定,即排序字段相同的记录,输出顺序可能与输入不同。不过,GNU 实现的 sort 命令在 coreutils 包中提供了 --stable 选项来解决这个问题,保证输出顺序与输入一致。

1.2 去除重复记录

去除连续重复记录也是常见需求。 sort -u 可以完成此任务,但它是基于匹配键而非完整记录。 uniq 命令提供了另一种过滤数据的方式,常与 sort 结合使用,如 sort ... | uniq | ... uniq 有三个常用选项:
- -c :在每行输出前加上该行出现的次数。
- -d :只显示重复的行。
- -u :只显示不重复的行。

以下是示例:

$ cat latin-numbers
tres
unus
duo
tres
duo
tres
$ sort latin-numbers | uniq
duo
tres
unus
$ sort latin-numbers | uniq -c
      2 duo
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值