上周组里同学给了一个数据任务:
1.在hive上传汽车词包
2.根据汽车词包圈出指定时间段内的cookie
3.根据cookie找出这些用户的所有搜索记录
4.从所有搜索数据中找到含有明星的搜索记录
5.根据每个明星group by,计数
我的解决办法如下:
1.第一第二第三阶段我写了一个sql语句
2.第四阶段我用了python处理,因为我无法写成
select query
from sousuo
where query like
上周组里同学给了一个数据任务:
1.在hive上传汽车词包
2.根据汽车词包圈出指定时间段内的cookie
3.根据cookie找出这些用户的所有搜索记录
4.从所有搜索数据中找到含有明星的搜索记录
5.根据每个明星group by,计数
我的解决办法如下:
1.第一第二第三阶段我写了一个sql语句
2.第四阶段我用了python处理,因为我无法写成
select query
from sousuo
where query like