Hadoop Counters是用于计数的,我们可以定义一些计数器,用于执行过程的计数,在执行完任务,会将计数器的值打印在控制台,也可以通过WEB查看,方便调试,因为在执行MapReduce的过程中,不能打印信息:
定义格式如下:
- HadoopPipes::TaskContext::Counter*mapCounter;
注册:
- mapCounter = context.getCounter("myCounter", "mapCounters");//注册,myCounter代表它所在的组,mapCounters表示名称
使用:
- context.incrementCounter(mapCounter,1);
完整代码例子:
- class WordCountMap: public HadoopPipes::Mapper {
- public:
- HadoopPipes::TaskContext::Counter* mapCounter;//定义
- public:
- WordCountMap(HadoopPipes::TaskContext& context){
- mapCounter = context.getCounter("myCounter", "mapCounters");//注册,myCounter代表它所在的组,mapCounters表示名称
- }
- void map(HadoopPipes::MapContext& context) {
- std::vector<std::string> words =
- HadoopUtils::splitString(context.getInputValue(), " ");
- for(unsigned int i=0; i < words.size(); ++i) {
- context.emit(words[i], "1");
- }
- context.incrementCounter(mapCounter,1);//使用
- }
- };
运行之后在控制台看到:
在WEB的任务跟踪页面看到: