
Hive
文章平均质量分 82
问题不太大
这个作者很懒,什么都没留下…
展开
-
Iceberg 合并小文件并删除历史(Flink)
Iceberg 合并小文件并删除历史(Flink)Iceberg每一次操作都会产生多个数据文件(metadata、data、snapshot),需要自行合并清理。详细Iceberg写入时文件变化请参考官网https://iceberg.apache.org/建表时新增with配置# iceberg使用代码合并小文件后如果不开启此配置,历史文件同样不会删除,开启后就会实现合并后清除历史文件(历史文件保留最大值为5,metadata和data里面文件数则始终保持为6个) # 启用提交后写入元数据原创 2021-10-14 17:53:45 · 37832 阅读 · 0 评论 -
org.apache.iceberg.hive.HiveTableOperations$WaitingForLockException: Waiting for lock.
报错信息org.apache.iceberg.hive.HiveTableOperations$WaitingForLockException: Waiting for lock. at org.apache.iceberg.hive.HiveTableOperations.lambda$acquireLock$9(HiveTableOperations.java:444) ~[dw-0.1.jar:?] at org.apache.iceberg.util.Tasks$Builder.runTask原创 2021-09-28 18:05:45 · 35724 阅读 · 2 评论 -
Hive HBase 集成
Hive HBase集成Avro 数据存储在 HBase 列中介绍用法列映射多个列和列簇Hive MAP 到 HBase 列族Hive MAP 到 HBase 列前缀隐藏列前缀非法:Hive 原语到 HBase 列族二进制列示例简单的复合行键(As of Hive 0.13.0)复杂的复合行键和 HBaseKeyFactoryAvro 数据存储在 HBase 列中(As of Hive 0.14.0)Avro 数据存储在 HBase 列中版本信息:Avro 数据存储在 HBase 列中 从 Hive原创 2021-07-13 15:17:44 · 43148 阅读 · 1 评论 -
基于腾讯云EMR的Flink1.10 Catalog 集成 Hive2.3.7 大坑
基于腾讯云EMR的Flink1.10 Catalog 集成 Hive2.3.7 大坑正常Flink集成Hive**`但是问题来了:`**解决方案正常Flink集成Hive普通版本Flink Catalog集成Hive的元数据时根据Flink官网一步一步来是没有问题的。官网给了Hive各个版本集成时应该去拷贝哪些jar包这些都是正常的操作流程,然后还要sql-client的配置方式也有说明。看到这里可以说是照着官网有手就能干,保姆式服务,下面官方还给出了Flink的Catalog对Hive的支原创 2021-06-08 17:02:49 · 44346 阅读 · 0 评论 -
Hive安装(超详细)
Hive安装前提环境Hive安装解压文件修改配置文件HDFS创建Hive工作空间配置Hive环境变量Hive启动替换Hive原生MetaStore前提环境Linux基础设置以及Hadoop环境安装请看上一篇文章Hive安装解压文件[root@localhost ~]# tar -zxvf apache-hive-1.2.2-bin.tar.gz -C /opt/install/修改配置文件[root@localhost apache-hive-1.2.2-bin]# cd /opt/in原创 2020-06-24 18:03:00 · 33417 阅读 · 4 评论 -
Hadoop生态圈-Hive
HiveHive引言Hive的运行原理Hive环境搭建Hive基本操作MetaStore的替换问题Hive引言什么是Hive hive是facebook开源,并捐献给了apache组织,作为apache组织的顶级项目。 hive.apache.org hive是一个基于大数据技术的数据仓库技术 DataWareHouse (数仓) 数据库 DataBas...原创 2019-10-29 22:08:07 · 18925 阅读 · 0 评论