昨天听了manager从Google Cloud开发者大会2019回来的报告,发现自己对大数据里面很多基础知识都不懂好惭愧,最近空空闲时间学习一下相关的概念,记录在这里。因为发现了这个博客总结得很好,大部分内容都是搬运来的。
参考 http://www.cnblogs.com/BYRans/
kafka:
Kafka简介 https://www.cnblogs.com/BYRans/p/6054930.html
RocketMQ与Kafka对比(18项差异)https://www.cnblogs.com/BYRans/p/6100653.html
Spark:
Spark存储管理(读书笔记)https://www.cnblogs.com/BYRans/p/5945667.html
Spark调度管理(读书笔记)https://www.cnblogs.com/BYRans/p/5943946.html
Spark基本工作流程及YARN cluster模式原理

本文介绍了Kafka、Spark和YARN的基础知识,Kafka是一个高吞吐、可扩展的分布式消息系统,常用于大数据实时处理;Spark提供了高效的存储管理和调度管理功能,适合大规模数据处理;YARN作为Hadoop的资源管理系统,负责集群资源的调度和管理。
最低0.47元/天 解锁文章
184

被折叠的 条评论
为什么被折叠?



