awk与shell效率比较

本文介绍两种文件对比方法,一种使用shell脚本逐行读取并对比,另一种利用awk进行内存计算。后者处理大量数据时速度远超前者,适用于快速找出两个文件间的差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 需求:对比2个文件,找出仅存在文件A中的行

  • 方法1

cat fileA | while read line
do
get=
cat fileB|grep $line
if [[ x"$get" == x ]] ;then
echo $line >> diff.log
fi
done

  • 方法2

方法2:
awk '{if(ARGIND==1){val[$0]}else{if($0 in val) delete val[$0]}}'END'{for(i in val) print i}' fileA fileB


  • 效率

方法2的效率远高于方法1,处理300w数据,方法1天级,方法2秒级。原因:方法2,awk将所有数据装入内存计算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值