
Hadoop
chang_harry
Java高级软件工程师Hadoop研究者数据挖掘研究者大数据分析处理研究者IT项目管理人员
展开
-
图解Hadoop生态系统
http://www.youkuaiyun.com/article/2013-03-11/2814446-hadoop_ecosystem_infographic转载 2013-03-11 22:52:09 · 420 阅读 · 0 评论 -
hadoop MapReduce开发调试实践得出的2点体会
今天折腾了一天,终于搞明白了几点:1. Mapper和Reducer的单元测试可以在windows环境下的Eclipse中进行。 我用的hadoop 1.1.1。 需要有hadoop-core-1.1.1.jar,MRunit0.9.0, Mockito-all-1.8.5.jar, 还有几个hadoop 1.1.1的lib目录下的几个包。 要用MRUnit Tutor原创 2013-03-11 17:41:10 · 676 阅读 · 0 评论 -
"hadoop fs -conf " does not work
> 150Lthe following is written.----------------------------------------------------------------------------------------------------------------------With this setup, it is easy to use any c原创 2013-03-13 22:38:19 · 703 阅读 · 0 评论 -
中小规模Hadoop集群优化
中小规模Hadoop集群优化来源: 白伯纯的日志人人网的数据平台分为事前和事后两部分。事前数据分析是在开发阶段就有系统规划的统计点,事后数据分析恰恰相反,一般统计的是现有业务的历史。这两种方法是互补的,事先埋点的粒度更细,实时性更强,事后统计的适用范围更广,调整更灵活。我们的事后数据分析用Hadoop搭建。这个集群从上个月开始遇到一系列性能问题,在逐一解决的过程中,积累转载 2013-03-19 16:51:56 · 523 阅读 · 0 评论 -
Cygwin下配置ssh的问题--sshd服务没启动
On Windows with Cygwin, you can set up an SSH server (after havinginstalled the openssh package) by running ssh-host-config -y.Then type "ssh localhost". and i got a wrong message"ssh: connect t原创 2013-03-20 15:23:16 · 658 阅读 · 0 评论 -
Hadoop 解除 "Name node is in safe mode"
Hadoop 解除 "Name node is in safe mode"(转)(2011-08-02 20:10:40) 标签:杂谈 运行hadoop程序时,有时候会报以下错误:org.apache.hadoop.dfs.SafeModeException: Cannot delete/user/hadoop/input. Na转载 2013-03-20 23:39:23 · 552 阅读 · 0 评论 -
为什么每次重启机器后,namenode都启动不了,需要先hadoop namenode -format
每次重启机器后,直接键入命令$start-all.sh.然后从本地往hdfs中拷贝文件,$ hadoop fs -copyFromLocal ./gequ01.mp3 gequ02.mp3 都会发生错误。13/03/20 22:31:11 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8020. Alr原创 2013-03-20 23:37:50 · 1914 阅读 · 0 评论 -
Exception “File /user/SYSTEM/quangle2.txt could only be replicated to 0 nodes, instead of 1” 怎么解决?
while copying local files to hdfs, the following Exception occurred.$ hadoop fs -copyFromLocal input/quangle.txt quangle2.txt13/03/20 17:37:03 WARN hdfs.DFSClient: DataStreamer Exception: org.apac原创 2013-03-20 17:43:45 · 569 阅读 · 0 评论 -
nutch和lucene的区别
想做一个搜索引擎,最近浏览了许多社区,发现Lucene和Nutch用的很多,而这两个我总感觉难以区分概念,于是在查了些资料。下面是Lucene和Nutch创始人Doug Cutting 的访谈摘录: Lucene其实是一个提供全文文本搜索的函数库,它不是一个应用软件。它提供很多API函数让你可以运用到各种实际应用程序中。现在,它已经成为Apache的一个项目并被广泛应用着。这里列出一些已经使用转载 2013-03-24 23:33:12 · 443 阅读 · 0 评论