spark运行自带例子_Spark on Zeppelin Yarn 模式运行

本文介绍了如何在Spark on Zeppelin环境中配置Yarn模式,包括将`hive-site.xml`复制到Spark配置目录,修改`spark-env.sh`、`spark-defaults.conf`以确保Spark能找到必要的jar包,并在`zeppelin-env.sh`中进行相应配置。同时,需要替换Zeppelin目录下的某些jar包为Spark目录下的对应版本,以避免运行时错误。通过这些步骤,可以在Zeppelin上使用外部Spark并以Yarn模式运行代码。文章最后提出了一个问题,为何只能使用`yarn-client`模式,而不能使用`yarn-cluster`模式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、上篇文件介绍到Spark on Zeppelin 但是运行的是Zeppelin自带的spark,不能使用yarn模式,会导致很多问题的,今天介绍一下Spark On Zeppelin使用yarn模式配置以及运行代码。

二、相关配置

spark配置拷贝hive-site.xml到spark conf目录下

2463c4ec97693c8cebbdfe9f8ca62117.png

配置spark-env.sh

45ce796dc02affe4ee3416002dd6d8ad.png

配置spark-defaults.conf 为了spark on yarn找到相应的spark jar包,并将spark目录下的jar包上传到自建的hdfs目录上供代码运行时进行读取所需jar包

61a225928b0f80f0de3e3d0348c448c7.png

3388ca2d0d072eea1e6c079aa3dc8740.png

配置zeppelin-env.sh

af4d181dedfeaad4159f08eb1ce39a8b.png

替换zeppelin安装目录下的jar包

jackson-annotations-2.9.9.jar

jackson-core-2.8.10.jar

jackson-databind-2.9.10.1.jar

更换成spark安装目录下的jar包

jackson-annotations-2.6.7.jar

jackson-core-2.6.7.jar

jackson-databind-2.6.7.jar

如果上述jar包不更换会出现以下的报错

633d3ff6ddfc89f5a187d46bed580910.png

通过页面编辑相关执行器

c5f6fcf60f3f0a19b98b0dafd18b490d.png

创建NoteBook进行编写读取hdfs上数据和读取hive库数据

da7d65bb27d54cda0f981e3afe3715c3.png

2df0584dc280db372409fbad25136a88.png

yarn界面查看Zeppelin所提交的运行

ec87a5a0d19d526354bfd35e5593f0b2.png

综上所述spark在zeppelin上不使用自带spark利用外部spark,采用on yarn模式运行代码已经完成了。

思考:为什么只能采用 yarn-client模式呢?而不能采用yarn-cluster模式呢?

时间仓促如有错误恳请大家原谅,并指出错误526d2af59a601850467a313cf1cbefc7.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值