hadoop生态
文章平均质量分 87
legotime
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HiveQL数据定义
hive 是一个基于hadoop、处理结构化数据的数据仓库基础工具。它提供简单的sql查询功能 可以将sql语句转换为MapReduce任务进行运行 hadoop是一个开源的大型分布式处理框架,主要包含了两个模块,MapReduce和HDFS -----MapReduce:它是一种并行编程模型在大型集群普通硬件可用于处理大型结构化,半结构化和非结构化数据。 -----HDFS:Ha原创 2016-04-27 18:38:04 · 1782 阅读 · 0 评论 -
ubuntu下Hive安装
Hive安装和配置实践(1.2.1版本) 1:直接从官网(hive.apache.org)下载Hive,解压到你想要的文件夹下 2:环境设置: export HIVE_HOME=/usr/local/hive/apache-hive-1.2.1-bin export HIVE_CONF_DIR=$HIVE_HOME/conf export PATH下增加hive的bi原创 2016-03-22 19:50:40 · 928 阅读 · 0 评论 -
SparkSQL和Hive自定义函数对比
一、UDF UDF(User-Defined Function),指的是一个输入,一个输出 Hive环境下 1、准备数据 Michael, 29 Andy, 30 Justin, 19 2、上传HDFS原创 2017-02-10 16:41:39 · 1714 阅读 · 0 评论
分享