awk 'BEGIN {count=0;revsum=0;bdnum=1;click = 0;} {if($1!=0){bdid[count,0]=$1; bdid[count++,1]=$9;}; dis_bdid[0]=bdid[0,0]}
END{
for(i=0;i<count;i++)
{
for(j=0;j<bdnum;j++)
{
if (bdid[i,0]== dis_bdid[j])
{
break;
}
}
if (j==bdnum)
{
dis_bdid[bdnum++]=bdid[i,0]; click+=bdid[i,1];
}
print i" "bdid[i,0]};
print "rvcsum:" count;
print "bdnum:" bdnum ;
print clickuv: ”click;
}' part-0504-00000
END{
for(i=0;i<count;i++)
{
for(j=0;j<bdnum;j++)
{
if (bdid[i,0]== dis_bdid[j])
{
break;
}
}
if (j==bdnum)
{
dis_bdid[bdnum++]=bdid[i,0]; click+=bdid[i,1];
}
print i" "bdid[i,0]};
print "rvcsum:" count;
print "bdnum:" bdnum ;
print clickuv: ”click;
}' part-0504-00000
本文介绍使用 Awk 脚本实现特定的数据聚合任务,包括记录唯一ID的点击次数等关键信息。通过双重循环遍历,确保每条数据只被计算一次。
5774

被折叠的 条评论
为什么被折叠?



