6. hadoop
memewry
hi
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hadoop分布式并行编程入门
IBM Hadoop分布式并行编程系列:第一部分:http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop1/第二部分:http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/第三部分:http://www.ibm.co原创 2012-04-20 18:33:29 · 1984 阅读 · 0 评论 -
Nutch+Hadoop集群搭建
来源:http://www.open-open.com/lib/view/open1328670771405.html1、Apache Nutch Apache Nutch是一个用于网络搜索的开源框架,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。1.1、Nutch的组件结构WebDB:存储网页数据和连接信息Fetch转载 2012-07-16 00:00:11 · 732 阅读 · 0 评论 -
Hadoop 集群配置(最全面)
来源:http://www.open-open.com/lib/view/open1328536842327.html通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。这些机器是slaves\官方地址:(http://hadoop.apache.org/co转载 2012-08-20 12:43:42 · 457 阅读 · 0 评论 -
HAPOOP实战实例
来源:http://www.open-open.com/lib/view/open1328755683796.html Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分转载 2012-07-16 00:07:01 · 1306 阅读 · 0 评论
分享