- 博客(3)
- 收藏
- 关注
原创 深入了解Hiv
函数分类输入输出标准函数以一行数据的一列或多列数据作为输入且返回结果是一个值。聚合函数以多行的零列或多列的数据作为输入且返回单一值。表生成函数接受零个多多个输入且产生多列或多行输出。1.查看函数。
2024-06-28 17:29:53
1783
原创 Hive入门级教学
内部表类似于RDBMS中的表,电Hive管理,外部表指向已经存在HDFS中的数据,与内部表元数据组织是相同的,但其数据存放位置是任意的。外部表的真实数据不被Hive管理,即当删除. 张内部表时,元数据以及HDFS上的真实数据均被删除,而删除外部表则只会删除元数据面不会删除真实数据。RCFILE遵循“先水平划分,再垂直划分”的设计理念:首先把Hive表水平切分成多个行组,保证同一行的数据位于同一节点,其次在行组内按照“列”垂直切分,实现列与列的数据在磁盘上呈现为连续的存储块。RCFILE 存储格式如下所示。
2024-03-21 12:34:07
969
1
原创 Hive入门级教学
Hive 的元数据使用RDBMS存储,Hive 的数据存储在HDFS中,大部分数据查询由MapReduce完成。Hive 将用户的查询转换为一系列的 MapReduce 任务,并在 Hadoop 集群上执行这些任务,以实现对数据的处理和分析。而 Hive 则是基于 Hadoop 的分布式文件系统(HDFS),数据以文件的形式存储在多个节点上。总之,当我们使用Hive 时,操作接口采用类SQL语法,提高了快速开发的能力,避免了编写复杂的MapReduce任务,诚少了开发人员的学习成本,而且扩展很方便。
2024-03-21 11:53:41
1687
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人