Google的云计算基础架构模式包括4个相互独立又紧密结合的系统:Google File System分布式文件系统GFS,MapReduce编程模式,分布式的锁机机制Chubby,和大规模分布式数据库BigTable
1、Google File System 文件系统(GFS)
- 性能:可伸缩性、可靠性及可用性,同时受到 Google 应用负载和技术环境的影响,表现在4个方面
(1)应对大量节点的失效问题,通过软件将容错以及自动恢复功能集成在系统中
(2)构造特殊的文件系统参数,文件通常大小以 G 字节计,并包含大量的小文件
(3)增加文件追加操作,优化顺序读写速度
(4)文件系统的某些具体操作不再透明,需要应用程序的协助完成
- 一个GFS集群,包含一个主服务器和多个块服务器
- 大文件被分割成64MB的块,块服务器把块作为 Linux 文件保存在本地硬盘上,并根据指定的块句柄和字节范围来读写块数据
- 为保证数据可靠性,每个块被缺省保存 3 个以上的备份(冗余存储)
- Master主服务器 存放文件系统所有的元数据,包括名字空间、访问控制、文件到块的映射、块物理位置等相关信息