flink环境参数引起的错误

文章描述了在Flink1.13.5版本上,由于本地和集群环境的jar包冲突导致的问题,以及如何通过设置`-Dyarn.per-job-cluster.include-user-jar=FIRST`解决此问题。此外,还详细介绍了如何调整YARN集群的资源配置,包括并行度、内存和CPU使用,以适应不同的任务需求,以及如何处理网络缓冲区不足的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

环境参数:flink使用的版本是1.13.5、CentOS Linux 8

一,默认环境引起本地与集群的jar包冲突

遇到的情况是在idea执行的时候是没有问题的,然后打成jar包用集群执行的时候就会遇到问题。报错的时候会不太一,总之顺着错误去找的话会找到是代码中的哪个jar包产生了冲突发生的问题。比如有遇到如下错的

处理方法: 通过在启动脚本中增加如下命令:

-yD yarn.per-job-cluster.include-user-jar="FIRST"

将程序环境使用包的时候优先使用本项目包自己的,如果不设置的话是默认使用集群自带的,这也是为什么在本地能跑通但是上的集群就报jar包依赖冲突的原因。

该命令的功能如下所示:

二,提交脚步不同参数应对的需求

首先并行度是通过文件$config_path作为参数传递进去,然后在实际的代码中去设置的,用法如:

SingleOutputStreamOperator<String> FilterStream = SendStream
        .process(new SubGroupMemberProcessFunction())
        .setParallelism(MemberParallel)
        ;

在代码执行层面是通过process来执行类以及setParallelism来执行该类时的并行度。

1,最初的提交脚本是这么设置的

run_flink(){
/data0/flink/flink-1.13.5/bin/flink run -m yarn-cluster \
  -ynm Flink_Rt_global_pushClick \
  -ys 2 \
  -yd \
  -ytm 3072 \
  -yjm 2048 \
  -yD taskmanager.memory.jvm-metaspace.size=128mb \
  -yD taskmanager.memory.managed.size=0mb \
  -yD taskmanager.memory.jvm-overhead.min=512mb \
  -yD yarn.containers.vcores=1 \
  -c com.push.FlinkGlobalPushClickMain \
  flink-1.0-SNAPSHOT.jar \
  --config_path $config_path
}

后来发现集群中资源吃紧,因此就将ys的数值增加以此来减少cpu的使用:

run_flink(){
/data0/flink/flink-1.13.5/bin/flink run -m yarn-cluster \
  -ynm Flink_Rt_newimpression \
  -ys 4 \
  -yd \
  -ytm 3072 \
  -yjm 2048 \
  -yD taskmanager.memory.jvm-metaspace.size=128mb \
  -yD taskmanager.memory.managed.size=0mb \
  -yD taskmanager.memory.jvm-overhead.min=512mb \
  -yD yarn.containers.vcores=1 \
  -c com.push.FlinkGlobalPushClickMain \
  flink-1.0-SNAPSHOT.jar \
  --config_path $config_path
}

通过这种设置只有cpu的消耗从266核下降到了134核了,内存是有增加的。

(其实是牺牲了内存来换cpu的)

再接着是有的程序数据量比较大需要的资源更多因此并行度设置的就很大,这导致默认的taskmanager.memory.network是不够用的,报错如下:

java.io.IOException: Insufficient number of network buffers: required 2, but only 0 available. The total number of network buffers is currently set to 7782 of 32768 bytes each. You can increase this number by setting the configuration keys 'taskmanager.memory.network.fraction', 'taskmanager.memory.network.min', and 'taskmanager.memory.network.max'.

因此增加了taskmanager.memory.network.min和taskmanager.memory.network.max以此来保证程序在执行过程中即使并行度很大也能有足够的内存用于网络交互:

run_flink(){
  /data0/flink/flink-1.13.5/bin/flink run -m yarn-cluster \
  -ynm Flink_Rt_SPAndFR \
  -ys 4 \
  -yd \
  -ytm 3072 \
  -yjm 2048 \
  -yD taskmanager.memory.jvm-metaspace.size=128mb \
  -yD taskmanager.memory.managed.size=0mb \
  -yD taskmanager.memory.jvm-overhead.min=512mb \
  -yD yarn.containers.vcores=1 \
  -yD taskmanager.memory.network.min=650mb \
  -yD taskmanager.memory.network.max=3500mb \
  -c com.push.FlinkGlobalPushClickMain \
  flink-1.0-SNAPSHOT.jar \
  --config_path $config_path
}

这样程序就你能正确执行了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一杯拿铁go

你的打赏是我更新最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值