
mapreduce编程
文章平均质量分 82
lhb19891029
这个作者很懒,什么都没留下…
展开
-
mapreduce编程基础
. WordCount示例及MapReduce程序框架 首先通过一个简单的程序来实际运行一个MapReduce程序,然后通过这个程序我们来哦那个结一下MapReduce编程模型。 下载源程序:/Files/xuqiang/WordCount.rar,将该程序打包成wordcount.jar下面的命令,随便写一个文本文件,这里是WordCountMrtrial,并上传到hdfs上,这里的路径是/转载 2014-06-23 20:19:11 · 278 阅读 · 0 评论 -
hadoop基本命令
在这篇文章中,我们默认认为Hadoop环境已经由运维人员配置好直接可以使用。 假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop。 启动与关闭 启动HADOOP 1. 进入HADOOP_HOME目录。 2. 执行sh bin/start-all.sh 关闭HADOOP 1. 进入HADOOP_HOME转载 2014-06-19 16:40:34 · 242 阅读 · 0 评论 -
hadoop 容量能力调度器
计算能力/容量调度器(Capacity Scheduler)是Yahoo公司开发的多用户调度器。多用户调度器的使用场景很多,根据资料1的说法,Hadoop集群的用户量越来越大,不同用户提交的应用程序具有不同的服务质量要求(QoS): 1. 批处理作业:耗时较长,对完成时间没有严格要求。如数据挖掘、机器学习等应用。 2. 交互式作业:期望及时返回结果。如Hive等应用。 3. 生产原创 2014-06-19 15:11:30 · 316 阅读 · 0 评论 -
hadoop slot详解
Slots是Hadoop的一个重要概念。然而在Hadoop相关论文,slots的阐述难以理解。网上关于slots的概念介绍也很少,而对于一个有经验的Hadoop开发者来说,他们可能脑子里已经理解了slots的真正含义,但却难以清楚地表达出来,Hadoop初学者听了还是云里雾里。我来尝试讲解一下,以期抛砖引玉。 首先,slot不是CPU的Core,也不是memory chip,它是一个逻辑概念转载 2014-06-19 15:21:04 · 382 阅读 · 0 评论 -
mapreduce作业运行机制
可以只用一行代码代运行一个mapreduce原创 2014-07-20 19:35:35 · 475 阅读 · 0 评论 -
MapReduce 编程模型在日志分析方面的应用
简介 日志分析往往是商业智能的基础,而日益增长的日志信息条目使得大规模数据处理平台的出现成为必然。MapReduce 处理数据的有效性为日志分析提供了可靠的后盾。 本文将以对访问网页用户的日志进行分析,进而挖掘出用户兴趣点这一完整流程为例,详细解释 MapReduce 模型的对应实现,涵盖在 MapReduce 编程中对于特殊问题的处理技巧,比如机器学习算法、排序算法、索引机制、连接机转载 2014-06-23 21:16:01 · 299 阅读 · 0 评论 -
Ubuntu下eclipse开发hadoop应用程序环境配置
大家好,今天给大家介绍一下Ubuntu下eclipse开发hadoop应用程序环境配置,目的很简单,为进行研究与学习,部署一个hadoop运行环境,并搭建一个hadoop开发与测试环境。 环境:Vmware 10.0 和Ubuntu10.04 第一步:下载eclipse-SDK-4.2.1-linux-gtk.tar.gz http://mirrors.ustc.edu.cn转载 2014-07-14 15:36:12 · 330 阅读 · 0 评论