文章大纲 制作镜像 最小依赖需要些什么? jupyter 编写 pyspark 需要注意的问题 spark-submit 方式提交 Cluster 模式提交 Client模式提交 参考文献 制作镜像 这个不细谈了,主要建议直接使用官方提供的镜像。或者参加参考文件的方式 最小依赖需要些什么? #安装 pip install pyspark==2.4.7 sudo apt-get install openjdk-8-jdk pip install numpy #配置环境变量 SPARK_HOME = /opt/conda/lib