
Hive
文章平均质量分 90
王小雷-多面手
简单而真诚。专注大数据,机器学习,人工智能的多面手,对新兴的技术与知识充满了好奇与渴望!
展开
-
Hive基础(1)
1. Hive并不是分布式的,它独立于机器之外,类似于Hadoop的客户端。2. 元数据和数据的区别,前者如表名、列名、字段名等。3. Hive的三种安装方式内嵌模式,元数据服务和Hive服务运行在同一个JVM中,同时使用内嵌的Derby数据库作为元数据存储,该模式只能支持同时最多一个用户打开Hive会话。本地模式,元数据服务和Hive服务运行在同一个JVM中,采用了外置的MySQL作为元数据存原创 2016-04-17 18:17:51 · 978 阅读 · 0 评论 -
Hive的HQL(2)
1. HQL的数据定义,HQL是一种SQL方言,支持绝大部分SQL-92标准。但是和SQL的差异为:不支持行级别的操作,不支持事务等。HQL的语法接近于MySQL。2. Hive的数据库,本质仅仅是个表的目录或者命名空间。一般用数据库将生产表组织成逻辑组。3. Hive中的表–管理表,创建表时未指定的话为默认为管理表。当删除管理表时,Hive将删除管理表中的数据和元数据。CREATE TABLE I原创 2016-04-17 20:50:37 · 1129 阅读 · 0 评论 -
“卜算子·大数据”学习系列原创文章、源码——从入门到精通
大数据 big-data 转载请注明出处与作者信息(如下)原创作者:王小雷作品出自:https://github.com/wangxiaoleiAI/big-data联系邮件:wov@outlook.comStar Fork Follow 评论 issues项目地址 https://github.com/wangxiaoleiAI/machine-learning...原创 2018-06-14 10:26:01 · 1305 阅读 · 1 评论 -
卜算子·大数据简介 一个开源、成体系的大数据学习教程
第1章 卜算子·大数据简介“卜算子·大数据”,是一个开源、成体系的大数据学习教程。从基础数据采集到顶层架构设计。最新梳理出大数据知识体系共计12个部分,42个章节。每周日更新,金九银十际,助你上青天!本章主要内容:特点“卜算子·大数据”架构项目更新写作目的原创声明1.1 特点* 关于 * ——“卜算子·大数据”,其中“卜算子”是中国诗词中唯一包含计算、占卜、...原创 2018-06-29 11:50:52 · 2563 阅读 · 0 评论 -
Hive之UDFs(User-Defined Functions )
1.Hive之UDFs(User-Defined Functions )1.1 Hive UDFs (User Defined Functions) 可以在SQL处理比较繁琐或者无法胜任时,解决比较复杂数据处理手段。1.2 Hive的功能函数有哪些?内置操作(UDO)内置功能(UDF)内置聚合功能(UDAF)内置的表-生成功能(UDTF)自定义UDFs(本次主要是讲解自定义UDF)...原创 2019-03-22 11:17:56 · 1824 阅读 · 0 评论