
🏡 个人主页:IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-优快云博客
🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。
🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频
目录
Flink可以基于Yarn来运行任务,Yarn作为资源提供方,可以根据Flink任务资源需求动态的启动TaskManager来提供资源。Flink基于Yarn提交任务通常叫做Flink On Yarn,Yarn资源调度框架运行需要有Hadoop集群。
1. Flink不同版本与Hadoop整合
Flink基于Yarn提交任务时,需要Flink与Hadoop进行整合。Flink1.8版本之前,Flink与Hadoop整合是通过Flink官方提供的基于对应hadoop版本编译的安装包来实现,例如:flink-1.7.2-bin-hadoop24-scala_2.11.tgz ,在Flink1.8版本后不再支持基于不同Hadoop版本的编译安装包,Flink与Hadoop进行整合时,需要在官网中下载对应的Hadoop版本的“flink-shaded-hadoop-2-

本文详细介绍了Apache Flink在Yarn上的部署和配置,包括Flink与不同版本Hadoop的整合,Flink on Yarn的环境准备,以及任务提交测试。在Flink 1.8版本后,整合Hadoop需要特定的shaded jar,并在Flink 1.11版本后使用Hadoop2.8.5+的安装包。提交Flink任务的客户端需配置HADOOP_CLASSPATH环境变量,并确保安装了Hadoop2.10.2+版本。文章还演示了应用模式的任务提交过程和结果查看。
订阅专栏 解锁全文
1255

被折叠的 条评论
为什么被折叠?



