目录

分布式存储系统
分布式存储系统分为两大类中心化控制架构(HDFS)和完全无中心架构(Ceph)。
中心化控制架构:以单独元数据服务器为中间控制,具体数据存储服务器为分布式存储的架构存储。

用户第一步先访问元数据的服务器节点,这个元数据服务器为中间控制,每一次访问真正数据前,都需要先访问元数据服务节点,服务器节点存储的是元数据,元数据是描述数据的数据,元数据存储了真实数据的描述信息,包含具体数据的路径以及相关信息;
完全无中心架构:客户端通过设备映射关系计算出具体数据的位置,直接访问。客户端通过Mon通信服务,计算得到客户端需要写到的具体文件路径。
本文详细介绍了分布式系统的重要组成部分,包括分布式存储系统的中心化控制架构与无中心架构,如HDFS和Ceph;分布式计算系统如Hadoop MapReduce、Spark和Flink的特点及应用场景;分布式消息队列系统Kafka的工作原理;以及分布式机器学习的Spark ML和TensorFlow。此外,还探讨了SpringCloud和Dubbo分布式框架,以及分布式数据库TiDB、Google Spanner和OceanBase的应用。
订阅专栏 解锁全文
629

被折叠的 条评论
为什么被折叠?



