
Hive
木土a
这个作者很懒,什么都没留下…
展开
-
hive on spark 使用 collect_set 时出现org.apache.spark.sql.catalyst.expressions.UnsafeArrayData@852766e6
问题: hive on spark 使用collect_set 出现org.apache.spark.sql.catalyst.expressions.UnsafeArrayData@852766e6分析:UnsafeArrayData@852766e6 是看起来像java 的 Array 输出,既然这样那我们就把它转为字符串试试,hive 里类型转换是使用 cast( 参数 ...原创 2019-11-01 14:46:28 · 1485 阅读 · 0 评论 -
kafka创建消费者报错zookeeper is not a recognized option
在学习kafka时,创建消费者:./kafka-console-consumer.sh --zookeeper localhost:2181 --topic dblab --from-beginning时,报错zookeeper is not a recognized option,google下发现是最新版本中这种启动方式已经删除新启动方式:./kafka-console-consum...原创 2019-04-11 21:11:31 · 773 阅读 · 0 评论 -
Hive表(分区和分桶)
Hive分区描述: Hive分区根据某字段的值分区 1.可以多维度分区 2.分区不会影响大范围查询的执行效率 3.每个分区为一个目录 4.分区下可继续分区或者分桶 优点:限制在某个或者某些区间的值查询,处理速度会非常快 创建分区执行语句:PARTITIONED BY 例:创建日志表,按照dt与country分区 CREATE TABLE logs(ts bigint, ...原创 2019-04-03 14:34:38 · 223 阅读 · 0 评论