可以,例如我们的集群就是为了存储文件而设计的,不涉及到数据的计算,就可以将mapReduce都省掉。去掉之后就不排序了,不进行shuffle操作了。
比如,流量运营项目中的行为轨迹增强功能部分。
本文探讨了专为文件存储设计的集群架构,强调了在不需要数据计算场景下,如何简化MapReduce流程,避免排序和shuffle操作。以流量运营项目的行为轨迹增强功能为例,展示了存储优化策略。
可以,例如我们的集群就是为了存储文件而设计的,不涉及到数据的计算,就可以将mapReduce都省掉。去掉之后就不排序了,不进行shuffle操作了。
比如,流量运营项目中的行为轨迹增强功能部分。
6622
1217
2415

被折叠的 条评论
为什么被折叠?