我参考使用 Docker 快速部署 Spark + Hadoop 大数据集群 - 知乎
Bug:
里面的compose拉齐集群,但是出现一个致命的bug,普通用户,我下载不了pip所有包,包括jupyter,用exec -u 0 -it进去的root用户可以下载,但是却启动不了pyspark集群,会报
Pyspark: Exception: Java gateway process exited before sending the driver its port number
bug
解决bug在compose加上user:root