
Hadoop
feige1990
这个作者很懒,什么都没留下…
展开
-
Hadoop学习计划
学习Hadoop? Hadoop的源起与体系介绍;实施Hadoop集群;CDH家族 分布式文件系统HDFS原理与操作,HDFS API编程;2.x下HDFS新特性,高可用,联邦,快照 具有全部新特性的2.x企业级集群实施 Map-Reduce原理、体系架构和工作机制,eclipse与Hadoop集群连接,使用maven Map-Reduce编程实战,日志分析 M原创 2015-09-03 01:56:31 · 983 阅读 · 0 评论 -
Hadoop学习笔记1
1、MapReduce模型 MapReduce是一个分布式编程模型,主要用于处理和生成大规模数据集。 用户自定义一个Map函数处理一个KV对以生成一批中间的KV对,再定义一个Reduce函数将所有的中间KV对合并起来。 主要由Mapper和Reducer抽象类。Mapper负责对数据的分析处理,转换为KV的数据结构;Reducer获取Mapper出来的原创 2015-09-13 16:53:56 · 500 阅读 · 0 评论 -
网络上的学习笔记 Hadoop
1. 如今有10个文件夹,每个文件夹都有1000000个url.如今让你找出top1000000url (1)运用2个job,第一个job直接用filesystem读取10个文件夹作为map输入,url做key,reduce计算个url的sum, 下一个job map用url作key,运用sum 二次排序,reduce中取top10000000 (2)建hive表 A,挂原创 2015-10-09 17:56:46 · 794 阅读 · 0 评论