linux 文本文件的交集,差集 comm命令

本文详细介绍了如何使用comm命令比较两个已排序文件,并通过实例展示了如何过滤输出以仅显示两个文件中相同的行。同时,文章还提供了一种方法来去除输出中的行首定界符,以更清晰地呈现相同内容。
comm命令用于两个文件之间的比较,输入的文件必须是经过排过序的文件
例 :
[root@localhost test]# cat A.txt 
1
2
5
[root@localhost test]# cat B.txt 
1
3
6
[root@localhost test]# comm A.txt B.txt 
                1
2
        3
5
        6
其中第一列只在A.txt中出现 的行,第二列只在B.txt中出现的行,第三列表示在A.txt,B.txt都出现的行。
各列以\t作为定界符
如果只想输出某些列,可以有以下选项
-1从输出中删除第一列;
-2从输出中删除第二列;
-3从输出中删除第三列;
[root@localhost test]# comm A.txt B.txt -1 -2
1
这样就得到了两个文件中都有的行
如若想找到两个文件中不同的行,又想把他们都放到第一行,即把行首的\t去掉,则要加上sed,如下所示:
[root@localhost test]# comm A.txt B.txt -3 | sed 's/^\t//'
2
3
5
6

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值