Windows+Pycharm+Spark环境配置

本文详细介绍了如何在Windows上配置Pycharm与Spark环境,包括Python环境、Pycharm安装、Spark的下载与环境变量设置。通过在Pycharm中新建Python工程并导入pyspark模块,确保能成功调用Spark功能。最后,演示了编写word count代码并使用spark-submit运行,以验证环境配置的正确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、 环境配置
1)Python环境配置
2)Pycharm可在官网下载
3)以及相应版本的Spark下载。如登录Spark官网,下载1.6.0的版本。
- 并将压缩包解压,解压至相应路径,如D:\spark-1.6.0-bin-hadoop2.6。
- 添加 SPARK_HOME = D:\spark-1.6.0-bin-hadoop2.6。
- 并将 %SPARK_HOME%/bin 添加至环境变量PATH。
- 然后进入命令行,输入pyspark命令。若成功执行。则成功设置环境变量
这里写图片描述


二、pyspark模块导入
打开Pycharm,新建一个Python工程,以及新建word_count.py,执行以下代码,测试能否导入spark包

import os
# Path for spark source folder
os.environ['SPARK_HOME'] = "D:\spark-1.6.0-bin-
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值