
hive 学习记录
文章平均质量分 62
记录所有Hive的学习总结
苍老流年
对未来的不确定与焦虑保持独立的判断与认知
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive 环境搭建
实验环境安装在安装hive前,需要了解hive部署的三种模式:内嵌模式 内嵌模式的元数据采用hive自带的derby来存储。由于derby只支持同时一个用户访问所以生产环境下一般不推荐使用。本地数据库模式 hive元数据保存在本地数据库中。远程数据库模式 hive元数据保存在远程数据库中。本文讲解第三种部署方式,数据采用mysql。1.搭建hadoop...原创 2018-07-13 01:51:01 · 295 阅读 · 0 评论 -
hive 数据类型
数字类型TINYINT (1-byte signed integer, from -128 to 127)SMALLINT (2-byte signed integer, from -32,768 to 32,767)INT/INTEGER (4-byte signed integer, from -2,147,483,648 to 2,147,483,647)BIGINT (8-by...原创 2018-07-21 15:00:07 · 425 阅读 · 0 评论 -
hive如何实现行列转换
1. 行转列原始数据:nameconstellationblood_type孙悟空白羊座A大海射手座A宋宋白羊座B猪八戒白羊座A凤姐射手座A现在需要把星座和血型一样的人归类到一起。结果如下:射手座,A 大海|凤姐白羊座,A 孙悟空|猪八戒白羊座,B 宋宋# vim person.txt孙悟空,白羊座,A大海,射手座,A宋宋,白羊座,B猪八戒,白羊座,A凤姐,射手座,A# 创建hive表hive> c原创 2020-09-07 11:02:01 · 400 阅读 · 0 评论 -
hive四种排序order by,sort by,distribute by,cluster by的区别
1.数据准备创建person表CREATE TABLE `person`( `id` int, `name` string, `address` string)添加如下数据:hive> insert into person values(1, 'lisi', 'beijing');hive> insert into person values(2, 'zha...原创 2020-04-05 20:03:55 · 874 阅读 · 0 评论 -
Hive中各种Join的实现
left semi join返回两个表交集中左表的部分,Hive低版本中没有实现标准SQL中exist, in,因此它最主要的使用场景就是替代exist与in。这个需求在Hive低版本中可以使用left semi join实现,同时可以获得更好的性能。full outer join 是对左右两表求并集,两个表中不存在的key均赋值null。left outer join是以左表基准,右表不存在的key均赋值为null。right outer join以右表基准,左表不存在的key均赋值为null。原创 2024-11-07 19:49:54 · 471 阅读 · 0 评论