第一步:首先确定linux安装好了java可以查看安装的java版本(注安装时要配置环境变量)
第二步:进入已经解压好的hadoop目录中
上图就是我解压到的目录
第三步:配置hadoop
参考hadoop官网给出的步骤:
我自己的配置过程:
1、进入解压的hadoop的etc/hadoop目录里找到hadoop-env.sh文件(可以使用xftp5找到,使用Notepad++打开)
2、在export JAVA_HOME=写上自己的路径:如下图
3、可以进行本机测试了(参考官网的例子)
我的例子结果 :
我自己统计单词例子加深理解
1、在hadoop-2.9.0目录下创建个目录wcinput
2、在创建的目录创建个文件作为输入文件如:input2(随意取)
3、在input2文件里随意输入一些单词
4、统计出结果:[root@localhost hadoop-2.9.0]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.0.jar wordcount wcinput wcoutput
这里wordcount统计单词数
wcinput就是输入的文件目录
wcoutput之前没有创建但会生成这个目录,输出结果会在这里面
除了上面三个其余和官网例子一样,不过我的市hadoop-2.9.0的版本。
5、结果显示:
最后总结:自己为做毕设也是刚学,很多东西都不懂,学的磕磕碰碰的,加油吧,和我一样初学的人可以看hadoop官网的hadoop快速入门