
Hive
文章平均质量分 58
开发老张
这个作者很懒,什么都没留下…
展开
-
Zepplin 安装配置
Zepplin 可以查询很多种数据源,包括 Kylin、file、spark、flink、hbase、es 等等。原创 2022-11-09 16:24:39 · 903 阅读 · 0 评论 -
sqoop 从HDFS导出数据到MySQL8
当数仓运算完成后,需要导出结果到 MySQL 中时,报数据解析错误;经过一通检查发现 sqoop 语句写的并没有什么错误,分隔符也没问题,也都正常分割了,但就是往 MySQL 导入时报格式匹配错误;原创 2022-10-27 13:12:33 · 1340 阅读 · 0 评论 -
hive 连接错误
在 hive 客户端执行命令报错报如下错误或者连接到 hiveserver2 时候连接不上;或者启动 hiveserver2 时候不能正常启动,10000 端口打不开;此时通过查询 hive.log 日志都会发现让执行 ”mysqladmin flush-hosts“ 解决;原创 2022-10-25 16:27:49 · 2920 阅读 · 0 评论 -
collect_set 分组数据合并为数组
将分组中的一列信息组织成数组形式,类似的还有 collect_list。原创 2022-10-21 16:14:27 · 501 阅读 · 0 评论 -
Hive 动态分区
Hive 可以将一个未分区的表中的数据导入到一个分区表时候,将其中的一列作为动态分区导入到分区表的分区列中。原创 2022-09-27 12:13:19 · 833 阅读 · 0 评论 -
Hive 分区表
在 Hive 中,表的每一个分区对应表下的相应目录,所有分区的数据都是存储在对应的目录中;可以按照一定维度数据进行分区存放,查询时大幅增加查询效率,同时也可以查询跨多个分区的整数集;原创 2022-09-20 11:07:34 · 245 阅读 · 0 评论 -
Hive External Table 外部表
HIVE External Table 外部表,内部表与外部表区别,外部表示例原创 2022-09-20 11:00:00 · 1336 阅读 · 0 评论 -
Hive 上配置 Hive on Spark
在 Hive 上配置 Hive on Spark。原创 2022-09-16 10:35:13 · 2244 阅读 · 0 评论 -
Hive 安装配置
记录个 hive 的安装配置流程。原创 2022-09-09 10:25:05 · 504 阅读 · 0 评论