
Hive
正经黑天鹅
这个作者很懒,什么都没留下…
展开
-
Hive - 内建函数
Hive中带有一些函数,方便Hive SQL做出一些聚合、转换、分割操作。最常见的就是聚合函数(SUM,COUNT,AVG)。当然这些属于内建函数,就是当部署好Hive以后,这些函数都在,可以随时调用。查看一个函数的信息,比如查看SUM函数的信息,在Hive CLI中“desc function sum;”,如果说要详细信息:“show function extended sum;”。一、...原创 2018-06-15 22:05:55 · 325 阅读 · 0 评论 -
Hive - 简介和安装
一、产生背景初代的hadoop的MapReduce写起来非常的麻烦。兼容RDBMS人员的“云化”,方便使用类SQL操作大数据集。二、架构 根据上图可以知道,Hive的接口可以是命令行、JDBC(JDBC主要的作用就是去MySQL表中取结果信息)、Web等。一条Hive SQL会像一条SQL一样,语法解析,优化器优化,执行器执行。不同的事,执行器执行在分布式存储系统上(HDF...原创 2018-06-09 16:50:18 · 287 阅读 · 0 评论 -
Hive - 自建函数
Hive中和RDBMS中的语法类似也带有一些函数,方便做聚合、转化之用。如果想要显示内置函数可以使用show functions;查看。如果想要知道某个函数的用法可以使用desc function xxx;来查看用法。同样,想要详细写法就使用desc function extended xxx;来查看。常用的内建函数自建函数...原创 2018-06-18 10:18:18 · 1075 阅读 · 0 评论 -
Hive - DDL & DML
HiveSQL DDL HiveSQL中的DDL语言是对Hive表数据结构的操作,比如创建、修改、删除一张表。 Hive是构建在HDFS之上的,Hive的数据存放于HDFS之中,HDFS存储的是文件,怎么对应结构化数据,这就要求Hive必须要有存放元数据信息的Meta表,这个可以存放在RDBMS中。Hive与RDBMS中存储结构的对比 Hive中的存储结构其实就是DHFS的存...原创 2018-06-10 16:14:02 · 468 阅读 · 0 评论 -
Hive高级
Hive是一个客户端的概念,不存在集群的概念。所以没有概念说Hive有集群。不过可以部署一台两台的Hive Service 2,用来让客户端连接,提交Hive的作业。一、Hive的操作的方式1.1 HiveService 2 HiveService2是一个服务,使得客户端可以查询提交作业。客户端有哪写呢?beeline/webui/Java API等等。 启动方式:...原创 2018-07-29 17:31:37 · 609 阅读 · 0 评论