目录 大数据入门笔记Spark2运算效率 大数据入门笔记 【大数据入门笔记系列】写在前面【大数据入门笔记系列】第一节 大数据常用组件【大数据入门笔记系列】第二节 Zookeeper简介【大数据入门笔记系列】第三节 Hdfs读、写数据处理流程【大数据入门笔记系列】第四节 NameNode元数据缓存机制【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境(复杂版的WordCount) Spark2运算效率 第一节 影响生产集群运算效率的原因之概述第二节 影响生产集群运算效率之集群设置第三节 影响生产集群运算效率的原因之资源缺乏第四节 影响生产集群运算效率的原因之数据倾斜第五节 影响生产集群运算效率的原因之小文件第六节 影响生产集群运算效率的原因之网络IO