1.安装好JDK:
JDK所有人肯定都装了,这里就不细说明了。
2.安装Hadoop并配置环境变量:
hadoop下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/

解压hadoop-2.8.3.tar.gz特定路径,如:D:\hadoop-2.8.3
添加系统变量HADOOP_HOME:D:\hadoop-2.8.3
在系统变量PATH中添加:D:\hadoop-2.8.3\bin
安装组件winutils:将winutils中对应的hadoop版本中的bin替换自己hadoop安装目录下的bin
3.Spark环境变量配置:
说明:spark是基于hadoop之上的,运行过程中会调用相关hadoop库,如果没配置相关hadoop运行环境,会提示相关出错信息,虽然也不影响运行。
下载对应hadoop版本的spark:https://www.apache.org/dyn/closer.lua/spark/spark-2.4.5/spark-2.4.5-bin-hadoop2.7.tgz。本人使用的是hadoop2.8.3版本,spark是

本文介绍了如何在PyCharm中搭建Django框架,并详细阐述了Spark开发环境的配置过程,包括JDK、Hadoop、Spark的安装与环境变量设置,以及在CMD和PyCharm中的验证和配置步骤。
最低0.47元/天 解锁文章
894

被折叠的 条评论
为什么被折叠?



