阿里云课程:云计算—分布式文件存储系统及实现

本文详细探讨了分布式文件存储系统的需求,包括大数据存储、高可用和低成本。介绍了面临的挑战如硬件故障和小概率事件,并讨论了如Ceph、HDFS和阿里云Pangu等系统的解决方案。此外,文章还涵盖了读写流程优化、QoS、Checksum、Replication、Rebalance、GC、Erasure Coding以及元数据管理的高可用和扩展性,展示了如何在实际操作中确保数据可靠性和系统性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分布式文件存储系统及实现(阿里云课程)

一、大数据对分布式存储的需求:

·存储容量大

·高吞吐量

·提高数据可靠性 8个9

·服务高可用 99.95%

·高效运维

将日常硬件处理作为常态,做成流程化

对于监控、报警等机制也要有非常完善的支持

·低成本

 

二、小概率事件对分布式系统的挑战

单击(桌面)系统:小概率出错

大规模存储:小概率成为常态

小概率事件:

1、磁盘错误

2、Raid卡故障

3、网络故障

4、电源故障

5、数据错误  磁盘、网络、内存

6、系统异常

7、热点

8、软件缺陷

9、误操作

 

三、常见分布式系统

ceph 无中心节点   mons 虽然也是比较重要的节点,但是存储的量比较少。

HDFS Namenode -> Metadata   Datanodes   Client 协议简单、不易出错、数据一致性容易保证  数据可分布在不同的Rack上去

阿里——Pangu系统

高性能设备作缓存,低性能设备作永久存储。

安全访问认证,用户访问时,带着认证信息。

审计,把所有操作存入日志文件中。

 

四、分布式存储设计要点

·读写流程 绕过慢节点、热节点

·Qos:服务质量

·Checksum

·Replication 复制

·Rebalance  重平衡

·Garbage Collection (GC) 垃圾回收

·Erasure Coding

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值