
HIVE
萌新Java程序猿
java个人心得
展开
-
Hive个人心得笔记之基础指令
Hive个人心得笔记之基础指令一.基础指令desc 表 查看表结构没有主键,可以重复提交手动提交 效率过低,可以通过文件形式传输 load data local inpath '/home/software/1.txt' into table stu; 通过加载文件数据到指定的表...原创 2019-07-09 18:42:27 · 326 阅读 · 0 评论 -
Hive个人心得笔记之表结构,数据类型,join
Hive个人心得笔记之表结构,数据类型,join目录 Hive个人心得笔记之表结构,数据类型,join一.连接-join1.建表:2.查询:3.inner join4.left join5.right join6.Full outer join7.left semi join1.创建...原创 2019-07-09 19:12:18 · 510 阅读 · 0 评论 -
Hive个人心得笔记之内置函数、UDF
Hive个人心得笔记之内置函数目录 Hive个人心得笔记之内置函数一.内置函数二.运算符一、关系运算符二、算数运算符三、逻辑运算符三.函数一、数学函数二、类型转换函数三、日期函数四、条件函数五、字符串函数六、聚合函数四.explode一、概...原创 2019-07-09 19:38:24 · 700 阅读 · 0 评论 -
Hive个人心得笔记之JDBC
Hive个人心得笔记之JDBC目录 Hive个人心得笔记之JDBC一.Hive的JDBC一、概述二、实现步骤:1.在服务器端开启HiveServer服务:一.Hive的JDBC一、概述hive实现了jdbc接口,所以可以通过java代码操作 hive的jd...原创 2019-07-09 20:19:50 · 1068 阅读 · 0 评论 -
Hive个人心得笔记之Hive优化
Hive个人心得笔记之Hive优化一.Hive的优化Hive的优化小表缓存:将小表的放入内存中,减少对磁盘以及网络消耗 在做join查询的时候,如果有附带的查询条件,那么最好先用子查询将符合条件的数据查询出来之后再进行连接查询 - 目的:减少笛卡尔积的数据量 如果去重和聚合同时出现,尽量先用子查询进行去重,然后再进行聚合1....原创 2019-07-09 21:26:04 · 406 阅读 · 0 评论 -
Hive个人心得笔记
Hive个人心得笔记一、Hadoop开发存在的问题只能用java语言开发,如果是c语言或其他语言的程序员用Hadoop,存在语言门槛 需要对Hadoop底层原理,api比较了解才能做开发 开发调试比较麻烦二、Hive概述Hive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张表,并提供完整...原创 2019-07-06 15:07:08 · 7106 阅读 · 0 评论 -
Hive个人心得笔记之数据库和数据仓库
Hive个人心得笔记之数据库和数据仓库一、数据仓库和数据库对比 数据库 数据仓库 为线上系统提供实时数据 为离线分析存储历史数据 具有完整的增删改查的能力 只支持一次写入多次查询,不支持行级别的增删改 具有完整的事务能力 ...原创 2019-07-06 15:11:30 · 680 阅读 · 0 评论 -
Hive个人心得笔记之安装
Hive个人心得笔记之安装目录 Hive个人心得笔记之安装一.Hive安装二.Mysql安装一.卸载删除Percona和Mysql相关依赖二.执行命令全部卸载三.下载安装即可四.下载完成五.安装客户端,服务端六.新增mysql用户组,并创建m...原创 2019-07-06 16:07:21 · 1005 阅读 · 0 评论