centos7部署hadoop2.8.5 分布式部署

最新推荐文章于 2024-07-24 02:10:06 发布

node_One

最新推荐文章于 2024-07-24 02:10:06 发布

阅读量260

点赞数

CC 4.0 BY-SA版权

分类专栏： hadoop

本文链接：https://blog.youkuaiyun.com/node_One/article/details/103224321

hadoop 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍如何在三台机器上搭建Hadoop集群，包括关闭防火墙、SELinux，配置免密登录，部署JDK，配置Hadoop核心参数，以及启动和测试集群的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

由于资源有限，部署只用了三台机器，一台master，两台slave，三台机器之间互做免密，互做解析，主机名-和解析的名字一定要一样，基础环境比较好弄，要细心，

关闭你所准备的机器上的防火墙，selinux。swap

systemctl stop firewalld

systemctl disable firewalld

vim /etc/selinux/config

把selinux的值更改成disabled

三台机器彼此之间需要互相做免密

master上执行

ssh-keygen -t rsa 或者是 dsa

然后一路回车

然后ssh-copy-id hadoop-master

ssh-copy-id hadoop-slave1

ssh-copy-id hadoop-slave2

slave1上执行

ssh-keygen -t rsa 或者是 dsa

然后一路回车

然后ssh-copy-id hadoop-master

ssh-copy-id hadoop-slave1

ssh-copy-id hadoop-slave2

slave2上执行

ssh-keygen -t rsa 或者是 dsa

然后一路回车

然后ssh-copy-id hadoop-master

ssh-copy-id hadoop-slave1

ssh-copy-id hadoop-slave2

三台都要如此操作

hadoop跑起来需要java环境所以咱们要部署一个jdk我选的jdk是1.8，首先下载一个jdk往期里边有，请看，

简单的部署就是将jdk下载到服务器然后将他存放到规划的目录下，然后将这个具体的路径配置到。/etc/profile中

然后重新加载一下这个文件，source /etc/profile 就完事

下载自己需要的版本hadoop，我用的包是 2.8.5

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.8.5.tar.gz

然后解压

tar -xzvf hadoop-2.8.5.tar.gz

只需要在一台机器上更改配置，完成以后scp到其他机器上

mv hadoop-2.8.5 hadoop

vim /usr/local/src/hadoop/etc/hadoop/core-site.xml



<configuration>
      <property>
                <name>fs.defaultFS</name>
                <value>hdfs://hadoop-master:8020</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/usr/local/src/hadoop/hadoop_tmp</value>
        </property>
        <property>
                <name>io.file.buffer.size</name>
                <value>4096</value>
        </property>
</configuration

vim /usr/local/src/hadoop/etc/hadoop/hdfs-site.xml


<configuration>

    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/src/hadoop/hdfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/src/hadoop/hdfs/data</value>
    </property>
    <property>
        <name>dfs.http.address</name>
        <value>hadoop-master:50070</value>
    </property>
    <property>
        <name>dfs.secondary.http.address</name>
        <value>hadoop-master:50090</value>
    </property>
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
    <property>
        <name>dfs.permissions</name>
        <value>false</value> </property>
</configuration>

cp mapred-site.xml.template mapred-site.xml

vim /usr/local/src/hadoop/etc/hadoop/mapred-site.xml

<configuration>
     <!--指定maoreduce运行框架-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value> </property>
<!--历史服务的通信地址-->
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoop-master:10020</value>
    </property>
<!--历史服务的web ui地址-->
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoop-master:19888</value>
    </property>
</configuration>

[root@hadoop-master ~]# vim /usr/local/src/hadoop/etc/hadoop/yarn-site.xml 


        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>hadoop-master</value>
        </property>
        <property>
                <name>yarn.resourcemanager.address</name>
                <value>${yarn.resourcemanager.hostname}:8032</value>
        </property>
        <property>
                <name>yarn.resourcemanager.scheduler.address</name>
                <value>${yarn.resourcemanager.hostname}:8030</value>
        </property>
        <property>
                <name>yarn.resourcemanager.webapp.address</name>
                <value>${yarn.resourcemanager.hostname}:8088</value>
        </property>
        <property>
                <name>yarn.resourcemanager.webapp.https.address</name>
                <value>${yarn.resourcemanager.hostname}:8090</value>
        </property>
        <property>
                <name>yarn.resourcemanager.resource-tracker.address</name>
                <value>${yarn.resourcemanager.hostname}:8031</value>
        </property>
        <property>
                <name>yarn.resourcemanager.admin.address</name>
                <value>${yarn.resourcemanager.hostname}:8033</value>
        </property>
        <property>
                <name>yarn.nodemanager.local-dirs</name>
                <value>/usr/local/src/hadoop/hadoop_tmp/yarn/local</value>
        </property>
        <property>
                <name>yarn.log-aggregation-enable</name>
                <value>true</value>
        </property>
        <property>
                <name>yarn.nodemanager.remote-app-log-dir</name>
                <value>/usr/local/src/hadoop/hadoop_tmp/logs</value>
        </property>
        <property>
                <name>yarn.log.server.url</name>
                <value>http://hadoop-master:19888/jobhistory/logs/</value>
                <description>URL for job history server</description>
        </property>
        <property>
                <name>yarn.nodemanager.vmem-check-enabled</name>
                <value>false</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
                <name>yarn.nodemanager.resource.memory-mb</name>
                <value>2048</value>
        </property>
         <property>
                <name>yarn.scheduler.minimum-allocation-mb</name>
                <value>512</value>
        </property>
        <property>
                <name>yarn.scheduler.maximum-allocation-mb</name>
                <value>4096</value>
        </property>
        <property>
                <name>mapreduce.map.memory.mb</name>
                <value>2048</value>
        </property>
        <property>
                <name>mapreduce.reduce.memory.mb</name>
                <value>2048</value>
        </property>
        <property>
                <name>yarn.nodemanager.resource.cpu-vcores</name>
                <value>1</value>
        </property>