Google File System 阅读笔记

本文详细解析了GFS系统的初始设计思路,重点介绍了使用廉价PC节点实现的复杂系统设计,强调了监控和容错的重要性。文章讨论了GFS架构的数据主从模式、元数据管理、操作日志处理、垃圾回收机制以及高可用性策略,提供了对大型分布式系统设计的深入洞察。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天终于拜读了著名GFS的论文,大体上的设计思路是明白了,复杂的系统,其实用了很多简单的逻辑在里面,下面是记录的一些笔记:

 

设计之初(系统需求)


系统使用便宜的PC节点来实现,所以对于监控和容错要求很高。

系统主要目标为提供大于100Mb的文件服务,常见文件为Gb以上,支持小文件,但是不做优化。

系统主要有两种类型的读:持续的流读和随机的跳读。同时还包括大文件、连续文件的写入和追加。

系统必须支持多客户。例如利用生产者-消费者队列模型或者其他的方法。

网路响应时间需要快。


GFS架构

 

数据的主从模式

Master的任务

Chunk Size的选择(64Mb)

Metadata特点:内存存储、Chunk的位置

Operation Log:如何处理并发的日志,如何确保日志安全(本地、远端同时写入才返回成功)


垃圾回收机制

在大型分布系统中,组件的失败非常常见。所以需要一种机制,来检查或者收回那些不一致的空间。


高可用策略

1、快速恢复。不管因为什么原因导致的服务终止,在数秒钟内恢复

2、块复制。

3、Master的复制以及Shadown,确保故障时文件的可读


数据一致性,一致性的信息存储在内存中,读取文件时进行验证 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值