Apache Flink连载（十二）：Flink集群部署-Flink On Yarn

原创已于 2023-12-28 00:24:53 修改 · 987 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#apache #flink #大数据

于 2023-12-13 07:30:00 首次发布

大数据计算体系技术栈同时被 2 个专栏收录

49 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

Apache Flink

38 篇文章

订阅专栏

本文详细介绍了Apache Flink在Yarn上的部署和配置，包括Flink与不同版本Hadoop的整合，Flink on Yarn的环境准备，以及任务提交测试。在Flink 1.8版本后，整合Hadoop需要特定的shaded jar，并在Flink 1.11版本后使用Hadoop2.8.5+的安装包。提交Flink任务的客户端需配置HADOOP_CLASSPATH环境变量，并确保安装了Hadoop2.10.2+版本。文章还演示了应用模式的任务提交过程和结果查看。

🏡 个人主页：IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-优快云博客

🚩 私聊博主：加入大数据技术讨论群聊，获取更多大数据资料。

🔔 博主个人B栈地址：豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频

1. Flink不同版本与Hadoop整合

2. Flink on Yarn 配置及环境准备

3. 任务提交测试

Flink可以基于Yarn来运行任务，Yarn作为资源提供方，可以根据Flink任务资源需求动态的启动TaskManager来提供资源。Flink基于Yarn提交任务通常叫做Flink On Yarn，Yarn资源调度框架运行需要有Hadoop集群。

1. Flink不同版本与Hadoop整合

Flink基于Yarn提交任务时，需要Flink与Hadoop进行整合。Flink1.8版本之前，Flink与Hadoop整合是通过Flink官方提供的基于对应hadoop版本编译的安装包来实现，例如：flink-1.7.2-bin-hadoop24-scala_2.11.tgz ，在Flink1.8版本后不再支持基于不同Hadoop版本的编译安装包，Flink与Hadoop进行整合时，需要在官网中下载对应的Hadoop版本的“flink-shaded-hadoop-2-