python开发spark步骤_Spark python安装【完全步骤】

本文详细介绍了在Windows 10上搭建Python开发Spark环境的步骤,包括安装Anaconda、Java 8、配置环境变量、下载并配置Spark(基于Hadoop 2.7)、安装Hadoop依赖,以及如何测试Spark的安装是否成功。每个步骤都提供了关键配置和注意事项,如配置JAVA_HOME、SPARK_HOME等环境变量,并强调了文件夹命名不能含有空格等细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,Spark python开发环境搭建的准备工作:

Win10 64位专业版

Anaconda3

Java 8 64位

Spark基于Hadoop 2.7 64位

下载和准备介质:

安装与配置Anacondahttps://www.anaconda.com/products/individual

安装与配置Javahttps://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html

安装与配置Spark https://spark.apache.org/downloads.html

安装与配置Hadoop依赖 https://spark.apache.org/downloads.html

测试spark .\bin\spark-shell  .\bin\pyspark

步骤截图:

1. 安装Anaconda,此步骤一般来说不会有任何问题,就像你安装其他电脑软件一样,下一步下一步,中间【记得勾选Add anaconda to the system PATH envrionment variables:】

2. 安装和配置JAVA,这个同上一步,一步步安装完后,记得配置环境变量:

首先,配置JAVA_HOME,在环境变量中新增系统变量JAVA_HOME,其值为JDK的安装目录:

a02fb4c78aba83e228d509fe59949ac7.png

其次,配置CLASSPATH,在系统变量中新增CLASSPATH,其值为".%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar" 【注意前面有个小圆点】

7c0de0b1be00ce2dc32f88109690dff5.png

以上步骤完成后,JAVA就安装好了,请在CLI(Command Line Interface)即Win+R运行中,输入CMD,再输入 java -version

4b0b3840d8aff3a16c6205fa7f422707.png

3. 安装和配置spark

下载好基于hadoop 2.7预编译的程序包,spark程序不需要安装,解压后即可直接使用,解压后复制到指定的文件夹,一般为放程序的文件夹,【注意】文件夹名中不可以有空格:

838ea6f5cd15b5b4fbdbcd634ae49422.png

环境变量:新增SPARK_HOME,其值为spark程序的文件路径,例如我们上面的截图是C:\spark

9205a226af1b7987e1b4461fd7f85000.png

接着将"%SPARK_HOME%\bin" "%SPARK_HOME%\sbin" 加入到PATH系统变量中:

ed383f33a6e60ed53658b7ebe710a1e4.png

接着配置日志显示级别,操作方法:复制spark\conf文件夹下的log4j.properties.template 为log4j.properties,即去掉template后缀,将root用户的日志级别设置为WARN

9712f409e45f38869288abff1aee1251.png

So far so Good?

4. 安装和配置Hadoop:

根据url下载https://github.com/LemenChao/hadoop.dll-and-winutils.exe-for-hadoop2.7.3-on-windows_X64

然后解压到自己创建的hadoop文件夹里:

8b84de1ce25f5ed080630cf813bb39bb.png

配置环境变量 HADOOP_HOME,新增HADOOP_HOME,其值为HADOOP文件所在目录:以上面的例子即C:\Program Files\hadoop

接着,将"%HADOOP_HOME%\bin"添加到PATH的系统变量里

5 测试:

在cmd中敲入spark-shell以及pyspark会分别得到如下两个截图的样子,即为ok,

或者敲入cd %SPARK_HOME%

再 .\bin\spark-shell

至此,应该无误。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值