- 博客(3)
- 收藏
- 关注
原创 Hadoop学习之Hive简介
1.Hive是什么 起源自facebook由Jeff Hammerbacher领导的团队 构建在Hadoop上的数据仓库框架 设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据 2008年facebook把hive项目贡献给Apache 由facebook开源,最初用于解决海量结构化的日志数据统计问题; ETL(Extraction-Transformation-Loading
2017-08-17 23:09:11
444
转载 hadoop学习之MapReduce笔记
MapReduce1.了解inputSplit转载于:http://blog.youkuaiyun.com/dr_guo/article/details/51150278 输入分片(Input Split):在进行map计算之前,mapreduce会根据输入文件计算输入分片(input split),每个输入分片(input split)针对一个map任务,输入分片(input split)存储的并非数据本身
2017-08-15 19:15:54
338
转载 大数据基础概念(1)
此博客转载于百度百科以及其他网站,用于学习交流 1.什么是大数据? 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值
2017-08-07 20:13:42
370
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅