
hadoop
pangliyewanmei
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop简要介绍
<br />这里先大致介绍一下Hadoop.<br /> 本文大部分内容都是从官网Hadoop上来的。其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了。我的这一个系列的Hadoop学习笔记也是从这里一步一步进行下来的,同时又参考了网上的很多文章,对学习Hadoop中遇到的问题进行了归纳总结。<br /> 言归正传,先说一下Hadoop的来龙去脉。谈到Hadoop就不得不提到Lucene和Nutch。首先,Lucene并不是一个应用程序,而是提供了一个纯Java的高性能全文索原创 2010-09-07 15:23:00 · 546 阅读 · 0 评论 -
Hadoop安装部署
<br />本文主要是以安装和使用hadoop-0.12.0为例,指出在部署Hadoop的时候容易遇到的问题以及如何解决。<br /><br />硬件环境<br />共有3台机器,均使用的FC5系统,Java使用的是jdk1.6.0。IP配置如下:<br />dbrg-1:202.197.18.72<br />dbrg-2:202.197.18.73<br />dbrg-3:202.197.18.74<br />这里有一点需要强调的就是,务必要确保每台机器的主机名和IP地址之间能正确解析。<br />一个很原创 2010-09-07 15:24:00 · 515 阅读 · 0 评论 -
简要介绍
<br />谈到Hadoop就不得不提到Lucene和Nutch。首先,Lucene并不是一个应用程序,而是提供了一个纯Java的高性能全文索引引擎工具包,它可以方便的嵌入到各种实际应用中实现全文搜索/索引功能。Nutch是一个应用程序,是一个以Lucene为基础实现的搜索引擎应用,Lucene为Nutch提供了文本搜索和索引的API,Nutch不光有搜索的功能,还有数据抓取的功能。在nutch0.8.0版本之前,Hadoop还属于Nutch的一部分,而从nutch0.8.0开始,将其中实现的NDFS和Ma原创 2010-12-06 15:42:00 · 1071 阅读 · 1 评论