Yarn部署

修改etc/hadoop/mapred-site.xml

复制 mapred-site.xml.template
在这里插入图片描述

cp mapred-site.xml.template mapred-site.xml

修改mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

修改etc/hadoop/yarn-site.xml:

vi yarn-site.xml

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

启动Yarn

[hadoop@hadoop000 hadoop-2.6.0-cdh5.7.0]$ sbin/start-yarn.sh

Jps检查进程

在这里插入图片描述

Web ui 界面

http://ip:8088
在这里插入图片描述

搞定!!!

### Flink on YARN 部署教程及配置操作指南 在 YARN部署 Flink 是一种常见的分布式计算方式,可以通过以下方法实现。Flink 提供了两种主要的部署模式:YARN Session 模式和 Per-Job 模式。以下是详细的配置与操作指南。 #### 1. 环境准备 在开始部署之前,确保已安装并正确配置以下组件: - HadoopYARN 集群。 - Flink 的二进制包已下载并解压。 - 编辑 Flink 的 `conf/flink-conf.yaml` 文件,根据实际需求调整配置项[^5]。 #### 2. YARN Session 模式部署 YARN Session 模式允许启动一个长期运行的 Flink 集群实例。以下是具体步骤: - **启动 YARN Session**: 使用以下命令启动一个 YARN Session: ```bash ./bin/yarn-session.sh -n <number-of-taskmanagers> -jm <jobmanager-memory> -tm <taskmanager-memory> ``` 参数说明: - `-n`: 指定 TaskManager 的数量。 - `-jm`: 指定 JobManager 的内存大小。 - `-tm`: 指定每个 TaskManager 的内存大小。 - **访问 Web 界面**: 一旦 JobManager 和 ApplicationMaster (AM) 成功启动,它们会运行在同一容器中[^3]。用户可以通过浏览器访问 Flink 的 Web 界面以监控集群状态。 #### 3. Per-Job 模式部署 Per-Job 模式允许直接在 YARN 上提交并运行单个 Flink 作业。任务完成后,YARN 集群将自动停止[^2]。以下是具体步骤: - **提交 Flink 作业**: 使用以下命令提交作业: ```bash ./bin/flink run -t yarn-per-job -c <main-class> <job-jar-file> ``` 参数说明: - `-t yarn-per-job`: 指定使用 Per-Job 模式。 - `-c`: 指定主类名称。 - `<job-jar-file>`: 提交的作业 JAR 文件路径。 #### 4. ZooKeeper 配置(可选) 如果需要启用高可用性 (HA),可以配置 ZooKeeper 作为仲裁服务。以下是启动 ZooKeeper 的示例命令: ```bash ./start-zookeeper-quorum.sh ``` 此命令通常用于多节点环境下的高可用性配置[^4]。 #### 5. 配置文件详解 Flink 的核心配置文件为 `flink-conf.yaml`,以下是一些关键配置项及其作用: - `jobmanager.rpc.address`: 设置 JobManager 的主机名或 IP 地址。 - `jobmanager.rpc.port`: 设置 JobManager 的通信端口。 - `taskmanager.memory.process.size`: 设置每个 TaskManager 的总内存大小。 - `taskmanager.numberOfTaskSlots`: 设置每个 TaskManager 的任务槽数量。 - `high-availability`: 启用高可用性模式,例如 `zookeeper` 或 `hdfs`。 - `fs.hdfs.hadoopconf`: 如果使用 HDFS 存储,需指定 Hadoop 配置文件路径。 #### 6. 常见问题排查 - **无法连接到 YARN**:检查 YARN 集群是否正常运行,并确保 Flink 能够访问 YARN ResourceManager。 - **内存不足**:根据实际需求调整 `-jm` 和 `-tm` 参数,确保分配足够的内存资源。 - **Web 界面不可用**:确认 JobManager 和 AM 是否成功启动,并检查端口配置是否正确。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值