hadoop数据分析

最新推荐文章于 2024-12-18 20:13:58 发布

原创最新推荐文章于 2024-12-18 20:13:58 发布 · 642 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop

hadoop 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了在Linux环境下安装单机版本的Hadoop2.6.4，包括配置环境变量、修改配置文件、启动服务及格式化HDFS，同时指导如何通过Java代码远程调用Hadoop进行MapReduce操作。

1、在linux下安装单机版本的hadoop2.6.4:
在解压后的文件 /etc/hadoop 下修改
* vi hadoop-env.sh
增加
export JAVA_HOME
如果已经配置了系统的环境变量，就不需要此步骤

vi core-site.xml

hadoop.tmp.dir
/hadoop/tmp

fs.default.name
hdfs://10.100.82.241:9000

vi mapred-site.xml

mapred.job.tracker
10.100.82.241:9001

vi yarn-site.xml

mapreduce.framework.name
yarn

yarn.nodemanager.aux-services
mapreduce_shuffle

vi hdfs-site.xml

dfs.replication
1

dfs.namenode.name.dir
/hadoop/hadoop-2.6.0/dfs/name

dfs.datannode.data.dir
/hadoop/hadoop-2.6.0/dfs/data

启动
格式化Hadoop的文件系统HDFS
bin/hadoop namenode -format
格式化完毕后再启动hadoop
sbin/start-all.sh

验证hadoop是否安装成功
http://localhost:50030 (MapReduce的web页面）
http://localhost:50070 (HDFS的WEB页面）
如果都能查看，说明hadoop已经安装成功
（注意防火墙开放着2个端口）
* 查看 jps
[root@localhost hadoop]# jps
5081 NodeManager
4885 SecondaryNameNode
5208 Jps
4255 ResourceManager
4753 DataNode
[root@localhost hadoop]#

查看report的信息
[root@localhost bin]# ./hadoop dfsadmin -report
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.

Configured Capacity: 18746441728 (17.46 GB)
Present Capacity: 15697825792 (14.62 GB)
DFS Remaining: 15697821696 (14.62 GB)
DFS Used: 4096 (4 KB)
DFS Used%: 0.00%
Under replicated blocks: 0
Blocks with corrupt replicas: 0
Missing blocks: 0

Live datanodes (1):

Name: 127.0.0.1:50010 (localhost)
Hostname: localhost
Decommission Status : Normal
Configured Capacity: 18746441728 (17.46 GB)
DFS Used: 4096 (4 KB)
Non DFS Used: 3048615936 (2.84 GB)
DFS Remaining: 15697821696 (14.62 GB)
DFS Used%: 0.00%
DFS Remaining%: 83.74%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Mar 03 17:14:01 CST 2016