CDH官方文档
https://docs.cloudera.com/documentation/enterprise/6/release-notes/topics/rg_cdh_63_packaging.html
为什么需要CDH?
https://blog.youkuaiyun.com/qq_41946557/article/details/103011675
如何正确使用CDH Spark?
- 在CDH中每个组件都分配有相应的用户、用户组,例如用户hdfs用于管理hadoop
在使用spark-submit提交任务时,如果使用的用户不是hdfs,则会提示权限错误无法在hdfs上创建文件或文件夹,正确的做法是使用sudo -u hdfs spark-submit
去提交任务