遇到一个细节问题,取夜间的数据,从22点到次日1点之间的数据怎么整?
select id from student where day>20200509 and hour>=22 and day<=20200510 and hour<=1 limit 10;
这个思路是清晰的,但hour限制的不对,因为不可能有既大于22又小于1的数存在,所以直接返回空。实际上这段时间有数据
这种情况要将day与hour拼接起来,一起使用,可以解决问题。感谢同事大佬。
补充:20200604 16:46
我想直接写成py脚本执行这个命令,但由于又增加了个限制比如,where gender='female'
这种的话就要引号里面套引号,套引号,因为最后还有个hive
三层引号问题怎么解决啊?最后这个用的
""" """
但是没有输出结果,不知道是没有数据还是没有存入(即,有问题)
直接hive读取一天数据都很慢,设置队列后速度快很多(该队列map 和reduce数很多,可能与此有关)
上面是有join的情况,我试试单个表,无论改成多短时间内的都不行的,这就蛋疼了。
For Video Recommendation in Deep learning QQ Group 277