
hive
春天的早晨
https://github.com/Allenmcc
展开
-
Hive 没有 not in 解决方案
hive 里面没有 not in ,where 查询时候可以 使用LEFT OUTER JOIN dpods_wfa_processhistory 表结构 需要查询 param不为 ‘协议被驳回&’ 的ProcessId max(AddTime), 因为where不能使用not in,下面sql将bb表新增a字段,值为1(param值为 协议被驳回&)然后左外连接时,空值为取出的值原创 2016-06-13 20:06:32 · 6441 阅读 · 0 评论 -
ETL的经验总结
ETL的考虑 做数据仓库系统,ETL是关键的一环。说大了,ETL是数据整合解决方案,说小了,就是倒数据的工具。回忆一下工作这么些年来,处理数据迁移、转换的工作倒还真的不少。但是那些工作基本上是一次性工作或者很小数据量,使用access、DTS或是自己编个小程序搞定。可是在数据仓库系统中,ETL上升到了一定的理论高度,和原来小打小闹的工具使用不同了。究竟什么不同,从名字上就可以看到,人家已经将倒转载 2017-06-12 17:36:04 · 4022 阅读 · 0 评论