
Hive
大数据之Hive相关
新新许愿树
人生就像滚雪球,关键是要找到足够湿的雪,和足够长的坡。
展开
-
Hive学习(一)大数据基础知识介绍
目录 Hadoop HDFS(Hadoop Distribute File System) MapReduce Yarn Spark 该系列文档是由学习 尚硅谷大数据课程之Hive 整理而来。若有不足之处,烦请批评指正! Hadoop Apache基金会所开发的分布式系统基础框架 用于解决 海量数据的存储和分析 问题 Hadoop生态圈:Hive、HBase、HDFS、Zook...原创 2019-12-21 17:41:09 · 333 阅读 · 0 评论 -
Hive学习(二)入门
目录 Hive是什么 Hive的优缺点 优点 缺点 Hive架构原理 用户接口:Client 元数据:Metastore Hadoop 驱动器:Driver Hive和数据库比较 查询语言 数据存储位置 数据更新 索引 执行 执行延迟 可扩展性 数据规模 Hive是什么 Hive是由 Facebook 开源用于解决海量结构化日志统计的数据仓库工具,可以将数据...原创 2019-12-21 17:34:35 · 205 阅读 · 0 评论 -
Hive学习(三)安装配置
目录 安装部署 Hive基本操作 将本地文件导入hive 查看在hive中输入的所有历史命令 Hive常见属性配置 数据仓库位置配置 查询后信息显示配置 运行日志信息配置 配置参数方式 官网地址:https://hive.apache.org/ 下载地址:https://www-eu.apache.org/dist/hive/ 官方wiki文档:https://cwiki....原创 2019-12-22 16:09:19 · 770 阅读 · 0 评论 -
Hive学习(四)数据类型
目录 基本数据类型 集合数据类型 类型转换 基本数据类型 Hive数据类型 Java数据类型 长度 例子 TINYINT byte 1byte 有符号整数 20 SMALINT short 2byte 有符号整数 20 INT int 4byte 有符号整数 20 BIGINT long ...原创 2019-12-20 16:50:31 · 133 阅读 · 0 评论 -
Hive学习(五)DDL数据定义
目录 数据库相关 创建数据库 查询数据库 切换数据库 修改数据库 删除数据库 表相关 创建表 管理表 外部表 管理表和外部表的相互转换 分区表 修改表 删除表 数据库相关 创建数据库 数据库在HDFS上的默认存储路径为:/user/hive/warehouse/*.db create database if not exists icydate; 也可以在创...原创 2019-12-20 15:14:09 · 555 阅读 · 0 评论 -
Hive学习(六)DML数据操作
目录 数据导入 装载数据(Load) 通过查询语句向表中插入数据(Insert) 查询语句中创建表并加载数据(As Select) 数据导出 清除表中数据 数据导入 装载数据(Load) 语法: load data [local] inpath 'file_path' [overwrite] into table tb_name [partition(partcol1=val...原创 2019-12-20 17:39:27 · 332 阅读 · 0 评论 -
Hive学习(七)查询
LIKE和RLIKE LIKE:%,_ RLIKE:支持Java的正则表达式;例,查找部门号中含有2的部门 :select * from dept_part where deptno RLIKE '[2]'; 大多数情况下,Hive会对JOIN连接对象启动一个MapReduce任务 如:FROM emp e JOIN dept d ON d.deptno = e.dep...原创 2020-01-06 16:20:25 · 407 阅读 · 0 评论 -
Hive学习(八)函数
内置函数 show functions desc function upper desc function extended upper(详细) 自定义函数 UDF(user-defiened fuction) UDF 一进一出 UDAF 聚集函数,多进一出 UDTF 一进多出 自定义函数 步骤: 1. 创建一个mave...原创 2020-01-06 16:30:43 · 354 阅读 · 0 评论 -
Hive学习(九)企业级调优
Fecth抓取 Fetch 抓取是指,Hive 中对某些情况的查询可以不必使用 MapReduce 计算。例如:SELECT * FROM employees; 在这种情况下,Hive 可以简单地读取 employees 对应的存储目录下的文件,然后输出查询结果到控制台。 在 hive-default.xml.template 文件中 hive.fetch.task.conversion 默...原创 2020-01-06 16:39:41 · 457 阅读 · 0 评论