搭建Spark单机版环境

本文详细介绍了如何在私有云上搭建Spark单机版环境,包括创建ied实例,连接虚拟机,修改主机名,配置IP与主机名映射,安装JDK和Spark,以及设置相关环境变量。此外,还讲解了使用SparkPi计算Pi值,启动Scala和Python版本的Spark-Shell,以及初步理解RDD的概念和操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录
零、本讲学习目标
一、搭建Spark单机版环境
(一)私有云上创建ied实例
(二)连接ied虚拟机
(三)修改ied实例主机名
(四)设置IP地址与主机名映射
(五)下载、安装和配置JDK
1、下载JDK压缩包
2、上传到ied虚拟机
3、将压缩包解压到指定目录
4、配置Java环境变量
(六)下载、安装与配置Spark
1、下载Spark安装包
2、将Spark安装包上传到ied虚拟机
3、将Spark安装包解压到指定目录
4、配置Spark环境变量
二、使用Spark单机版环境
(一)使用SparkPi来计算Pi的值
(二)使用Scala版本Spark-Shell
(三)使用Python版本Spark-Shell
(四)初步了解RDD
例1、创建一个RDD
例2、调用转化操作filter()
例3、调用行动操作first()
零、本讲学习目标
学会搭建Spark单机版环境
学会Spark应用程序的运行
学会启动Spark Shell
初步了解RDD的概念
一、搭建Spark单机版环境
(一)私有云上创建master实例(之前都创好了)
创建端口 - master_port
在这里插入图片描述

创建实例 - master
在这里插入图片描述

(二)连接master虚拟机
演示win7虚拟机通过FinalShell连接master虚拟机

(三)修改ied实例主机名
执行命令:hostnamectl set-hostname master
[外链图片转存失败,源站可能有防盗在这里插入!链机制,建描述]议将图片上https://传(imblog.csdnimg.cn/d76g41z2e8chT64f0ca408e0ed4b93cfe.png1)https://imgblog.csdnimg.cn/d768a041c2e64f0ca408e0ed4b193cfe.png)]

重启虚拟机
在这里插入图片描述

再次连接master虚拟机
在这里插入图片描述
在这里插入图片描述

(四)设置IP地址与主机名映射
执行命令:yum -y install vim,安装vim编辑器
在这里插入图片描述

执行命令:vim /etc/hosts
在这里插入图片描述

存盘退出,这样ping master就相当于ping 192.168.1.110
在这里插入图片描述

(五)下载、安装和配置JDK
1、下载JDK压缩包
下载链接:https://pan.baidu.com/s/1RcqHInNZjcV-TnxAMEtjzA 提取码:jivr
下载到win7虚拟机
在这里插入图片描述

2、上传到ied虚拟机
将JDK压缩包上传到master虚拟机/opt目录
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值