awk牛刀小试

本文介绍了一种使用awk命令处理邮件数据的方法,包括去除重复项、数据散列、按收件人分组及将数据切分为小块等操作。这些技巧对于进行批量邮件处理或数据分析非常有用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1+收件人唯一:awk -F, '{if($2!=second) print;second=$2}' notsns_other_mails.txt

 

2+投诉去重:awk -F, 'NR==FNR{list[$1]=$1}NR>FNR{if(!($1 in list))print $0}' delete.list notsns_other_mails.txt

 

3+数据散列: awk 'BEGIN{srand()}{b[rand()NR]=$0}END{for(x in b)print b[x]}' notsns_other_mails.txt

 

4+数据分块:awk -F, 'NR==FNR{list[$1]=$1}NR>FNR{if(!($1 in list))print $0}' delete.list notsns_other_mails.txt | awk '{print $0 > "tmp"int(NR/4)}'

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值