1.当 Python3.6 运行环境准备就绪,现在就可以启动 PySparkShell 交互编程环境了。(从 PySparkShell 启动输出的提示信息可以看出,Spark2.4.8 使用的是 Python3.6,这 也再次证明之前的配置是正确的)
2.类似 SparkShell 读取文件数据的做法,在这里同样测试一下 PySparkShell 中访问 本地和 HDFS 文件。请先确认一下 HDFS 服务是否正常运行,具体步骤参考前述内容即可,这 里假定 HDFS 已正常运行。请在 PySparkShell 中输入以下代码执行。
3.测试完毕,直接按下 Ctrl+D 快捷键,或者输入“quit()”就可以退出 PySparkShell 交互编程环境的界面。