device public set

本文介绍了一种通过分析广告请求流量来查找公共设备ID的方法。详细讨论了三种不同的技术方案:使用MapReduce、Hive表以及从请求日志中选择所有不同的设备ID。最终通过shell命令实现了目标。

backgroud:  our dvertiser provide on device list of idfa to show ad to  target audience,however none of the  ad shows ,so we want to know how many  public device id  in our traffic request。

to find the public  deviceid,we need to get all device id(idfa/google adid) in one day .

method1: use map reduce on azkaban ,however it failed . 

 

method2: use  hive tables;  insert  the deviceidlist to one table and  join  deviceids . 

 

 

method3: select  all distinct deviceids from request log   and output as a file , about 0.2 billion deviceid list  and file size 6G.

then use shell command just as this : 

grep -F -f a.txt  b.txt    >  public_ids.txt 

then ,we get the public deviceids . 

 

refer:http://blog.youkuaiyun.com/autofei/article/details/6579320

 

转载于:https://www.cnblogs.com/lavin/p/6912244.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值