
mapreduce
太阳的味道
活泼开朗、适应力强、认真负责、吃苦耐劳,有良好的学习、沟通、协调能力,具备良好的团队合作精神,对工作积极严谨。平时爱好户外运动,喜欢打羽毛球。
展开
-
hadoop streaming 配置项大全
Hadoop MapReduce和HDFS采用Java实现,默认提供Java编程接口,另外提供了C++编程接口和Streaming框架。Streaming框架允许任何程序语言实现的程序在Hadoop MapReduce中使用,方便已有程序向Hadoop平台移植。Streaming的原理是用Java实现一个包装用户程序的MapReduce程序,该程序负责调用MapReduce Jav转载 2013-07-15 11:34:52 · 2175 阅读 · 0 评论 -
Hadoop Streaming 常见错误
1、streaming默认的情况下,mapper和reducer的返回值不是0,被认为异常任务,将被再次执行,默认尝试4次都不是0,整个job都将失败[plain] view plaincopyjava.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess fa转载 2013-07-15 11:58:39 · 1817 阅读 · 0 评论 -
Hadoop Streaming 实战: 多路输出
streaming把reduce的输出作为一个任务的最终输出,输出文件形如: part-00000、part-00001…… 文件个数为reduce任务个数 但是,有的时候,我们有多路输出的需求,eg:一部分数据作为下一个mapreduce任务的输入,另一部分数据直接供下游任务抓取,此时,我们就需要使用reduce的多路输出。在hadoop-v2-u转载 2013-07-31 16:54:04 · 1087 阅读 · 0 评论 -
hadoop streaming 参数设置
Hadoop Streaming用法Usage: $HADOOP_HOME/bin/hadoop jar \$HADOOP_HOME/hadoop-streaming.jar [options]options:(1)-input:输入文件路径(2)-output:输出文件路径(3)-mapper:用户自己写的mapper程序,可以是可执行文件或者脚本(4)-reduce转载 2013-08-29 16:23:08 · 3403 阅读 · 0 评论 -
Hadoop --Aggregate 包使用 Streaming
Hadoop --Aggregate 包使用 Streaming Hadoop 中有个称为 Aggregate 的包.它把一些常用的功能包括在里面了,比如求和,求平均数等.每个功能对应一个函数.只需要在使用时声明用哪个即可.它的使用方式是在 reducer 脚本中直接写上函数的名称.它具体的功能有:DoubleValueSun 一个 double 值转载 2014-01-15 13:56:42 · 1137 阅读 · 0 评论