写shell脚本 .sh

本文详细介绍了一种使用Spark进行大数据处理的具体配置方法,包括如何通过nohup命令后台运行Spark任务,设置作业名称、主节点地址、内存分配、执行器核心数等参数。同时,分享了一个实际案例,演示了如何提交并运行一个名为EmgFilterDemo的Spark应用程序。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

nohup /opt/software/spark/bin/spark-submit \
--name "filtertest" \
--master spark://spark安装的主机名:7077 \
--executor-memory 10G \
--total-executor-cores 20 \
--class emg.branchs.EmgFilterDemo \
/opt/module/testcxb/original-emg.spark-1.0-SNAPSHOT.jar \
hdfs://192.168.40.51:9000/user/hive/warehouse/emg.db/d181119/* \
hdfs://192.168.40.51:9000/user/hive/zz  
> /opt/module/testcxb/filtertest.log 2>&1 &

代码如上

 

注意每一行后面的 \  一定注意

nohup 后台运行的意思

运行 .yunJob.sh 会自动把运行的日志放到nohup,out里面   不用自己创建   这种写法也不用再脚本里面加 #!/bin/bash

不知道怎么回事

注意!!!!  踩到坑了

以上的写法手动执行脚本好使   但是用crontab定时器一调就报错  找不到指定的读取路径!!!

以后还是把全都加上!!!

#!/bin/bash
source /etc/profile

nohup /opt/software/spark/bin/spark-submit \
--name "currentTime" \
--master spark://emg4052:7077 \
--executor-memory 10G \
--total-executor-cores 20 \
--class emg.branchs.EmgFilterDemo \
/opt/module/testcxb/currentTime.jar

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值