
Hive总结
文章平均质量分 81
Hive
岁月的眸
认定学习目标,不断提升自我!
展开
-
Hive集群高可用配置与impala集群高可用配置
使用Zookeeper实现了HiveServer2的HA功能(ZooKeeper Service Discovery),Client端可以通过指定一个nameSpace来连接HiveServer2,而不是指定某一个host和portMetastore高可用原理:Hive Metastore客户端始终使用第一个url连接到metastore服务器,如果Metastore服务器变得无法访问,则客户端从列表中随机选取一个url并尝试与之建立连接。原创 2023-09-20 01:54:55 · 955 阅读 · 0 评论 -
Spark SQL整合Hive与concat有关的三个函数concat(),concat_ws(),group_concat() 笔记
concat()的一个特殊形式,表示concat with separator,两个参数之间加上特定的分隔符。如果分割符为null,则返回null,参数为null,则忽略该参数。2、将Hadoop etc/hadoop文件夹中的 hdfs-site.xml、core-site.xml 拷贝到spark的conf下。1、拷贝Hive conf文件夹中的 hive-site.xml 文件夹到 spark的conf下(配置需要与资料中的文件保持一致!连接参数的函数,返回结果为连接参数的字符串。原创 2023-03-09 20:47:04 · 2056 阅读 · 0 评论 -
SQL的四种连接-左外连接、右外连接、内连接、全连接
SQL的四种连接-左外连接、右外连接、内连接、全连接原创 2023-02-23 17:31:30 · 1418 阅读 · 0 评论 -
记录SparkSql向hive的动态分区表插入数据失败的bug问题
记录SparkSql向hive的动态分区表插入数据失败的bug问题原创 2022-11-01 16:34:23 · 1585 阅读 · 0 评论 -
Hive未关闭表的事务功能(ACID)所引发的一系列Bug问题
Hive 未关闭表的事务功能(ACID)的问题原创 2022-10-31 00:02:50 · 2377 阅读 · 1 评论 -
SparkSql读取外部Hql文件的公共类开发
SparkSql读取外部Hql文件并执行和传参的公共类开发原创 2022-09-17 14:02:26 · 1289 阅读 · 0 评论 -
复盘离线电商数仓3.0项目–数据开发梳理
复盘离线电商数仓项目–数据开发梳理业务数据数仓分层ods层到ads层的开发开源BI工具SupersetODS层业务数据&日志数据ods层业务数据使用Sqoop脚本从Mysql数据库拉取数据落盘到hdfs然后创建ods层的外部表_分区表使用封装好的shell脚本将数据load到对应的表中,脚本如下(参考模板):#!/bin/bashAPP=gmallhive=/opt/module/hive/bin/hive# 如果是输入的日期按照原创 2022-03-24 15:24:51 · 4252 阅读 · 0 评论