hadoop、hbase、hive、spark分布式系统架构原理
转:https://blog.youkuaiyun.com/luanpeng825485697/article/details/80319552
机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据库,hbase是分布式kv系统,看似互不相关的他们却都是基于相同的hdfs存储和yarn资源管理,...
转载
2018-12-21 10:26:24 ·
330 阅读 ·
0 评论