
Hadoop
文章平均质量分 81
JasonTome
class Welcome To Myblog { public static void main(String[] args){ System.out.println(" I can changed the lives of others through technology and hard work!");}
展开
-
Hadoop集群配置(最全面总结) .
通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。这些机器是slaves\官方地址:(http://hadoop.apache.org/common/docs/r0.19.2/cn/cluster_setup.html)1 先决条件确保在你集群中转载 2012-02-09 13:16:11 · 553 阅读 · 0 评论 -
hadoop常见配置含义备忘录
列了很多配置的参数 其中红色的配置为必须配置参数 参数取值备注fs.default.nameNameNode 的URI。hdfs://主机名/dfs.hosts/dfs.hosts.exclude许可/拒绝DataNode列表。如有必要,用这个文件控制许可的datanode列表。dfs.replication转载 2012-02-29 14:04:54 · 421 阅读 · 0 评论 -
转载hadoop实践路上异常问题以及相关解决方法记录
hadoop实践路上异常问题以及相关解决方法记录,这篇文章不错,帮我解决了hadoop几个折腾了好久的问题,记录一下。原文转载自:http://rscala.com/index.php/38.html转载 2015-07-05 01:16:40 · 550 阅读 · 0 评论 -
spark学习之combineByKey函数
在数据分析中,处理Key,V alue的Pair数据是极为常见的场景,例如我们可以针对这样的数据进行分组、聚合或者将两个包含Pair数据的RDD根据key进行join。从函数的抽象层面看,这些操作具有共同的特征,都是将类型为RDD[(K,V)]的数据处理为RDD[(K,C)]。这里的V和C可以是相同类型,也可以是不同类型。这种数据处理操作并非单纯的对Pair的value进行map,而是针对不同的k转载 2017-04-27 13:29:58 · 1013 阅读 · 0 评论