window配置安装pyspark

本文详细介绍了在Windows环境下配置PySpark的过程及常见问题解决方案,包括如何设置环境变量以解决Java未找到的问题,并提供了在PyCharm中运行PySpark的具体步骤。

window配置安装pyspark,值得信赖的教程:win10下安装pyspark
,按照教程安装并配置好后,在cmd窗口下输入pyspark即可运行;但是,在pycharm下的黑窗口下输入pyspark,会报错:c:\Windows\System32>pyspark
Java not found and JAVA_HOME environment variable is not set.
Install Java and set JAVA_HOME to point to the Java installation directory.;待解决;

解决方法,增加如下:

import sys
import os
os.environ['SPARK_HOME'] = "E:/1/spark-2.3.0-bin-hadoop2.7/spark-2.3.0-bin-hadoop2.7"
os.environ['HADOOP_HOME'] = "E:/1/hadoop-2.7.1/hadoop-2.7.1"
sys.path.append("C:/Users/tsl/AppData/Local/Programs/Python/Python35/Lib")
sys.path.append("C:/Users/tsl/AppData/Local/Programs/Python/Python35")



下面这样写环境变量也可以:
import sys
import os
os.environ['SPARK_HOME'] = "C:/Users/tsl/AppData/Local/Programs/Python/Python35/Lib/site-packages/pyspark"
os.environ['HADOOP_HOME'] = "E:/1/hadoop-2.7.1/hadoop-2.7.1/bin/winutils/bin"
sys.path.append("C:/Users/tsl/AppData/Local/Programs/Python/Python35/Lib")
sys.path.append("C:/Users/tsl/AppData/Local/Programs/Python/Python35")
pyspark
<module 'pyspark' from 'C:\\Users\\tsl\\AppData\\Local\\Programs\\Python\\Python35\\lib\\site-packages\\pyspark\\__init__.py'>

先进入python ,再进入spark,可是这个没有直接进入pyspark有效!(待解决)
注意:.environ[‘SPARK_HOME’] = “E:/1/spark-2.3.0-bin-hadoop2.7/spark-2.3.0-bin-hadoop2.7”,这个路径是最终确定的有效路径,报错: raise Exception(“Java gateway process exited before sending the driver its port number”)
Exception: Java gateway process exited before sending the driver its port number
如果用:os.environ[‘SPARK_HOME’] = “C:/Users/tsl/AppData/Local/Programs/Python/Python35/Lib/site-packages/pyspark”
报错为:FileNotFoundError: [WinError 2] 系统找不到指定的文件。
,注意教程pycharm在windows下配置,在C:\Windows\System32\cmd.exe,以管理员权限打开,然后再运行E:\1\hadoop-2.7.1\hadoop-2.7.1\bin\winutils\bin\winutils.exe chmod 777 C:\tmp\hive,退出,再以管理员员身份进入cmd,输入pyspark,两个窗口区别:是否是以管理员身份打开的;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值