spark教程1 (cdh5.12 安装自带spark)

本文详细介绍如何在Cloudera CDH环境中部署Spark集群的过程,包括添加Spark服务、配置YARN资源参数及验证Spark运行状态等关键步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 1.在主页选择添加服务
    这里写图片描述
  • 2.选择spark
    这里写图片描述

  • 3.按步骤走下去,分配好history server和gateway 角色,我这里选择一个节点作为history server,所有节点作为gateway,添加好并启动好spark后如下
    这里写图片描述

  • 4.配置yarn服务,给节点添加yarn的gateway角色,然后重启yarn
    这里写图片描述

  • 5.修改一下yarn的yarn.scheduler.maximum-allocation-mb参数和yarn.nodemanager.resource.memory-mb参数,默认是1g比较小,可以先设置到2g,然后重启yarn
    这里写图片描述

  • 6 可通过以下代码检查spark是否正常运行

[hdfs@t0 bin]$ /opt/cloudera/parcels/CDH/lib/spark/bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster /opt/cloudera/parcels/CDH-5.12.0-1.cdh5.12.0.p0.29/lib/spark/lib/spark-examples.jar 10
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值