一、对于大数据的存储
- 单机时代-------------------- RAID
- 分布式时代 -----------------分布式文件系统
二、大规模数据存储的核心问题
- 数据容量问题
- 数据读写速度问题
- 数据可靠问题
三、RAID(Redundant Arrays of Independent Drives)
- RAID 0 :速度快,但不做数据备份。无数据冗余的的存储空间条带化,数据在从内存缓冲区写入磁盘时,根据磁盘数量将数据分为N份,这些数据同时并发写入N块磁盘。
- RAID 1: 可靠性高。使用磁盘镜像(Disk mirroing)技术,将一份数据同时写入两块磁盘。
- RAID 10: 提高可靠性,改善性能。将N块磁盘平均分成两份,在每一份磁盘中采用RAID 0技术将数据同时存入两份磁盘,相当于RAID 1。
- RAID 3:将数据并发写入N-1块磁盘,并在第N块磁盘记录效验数据,导致第N块磁盘比其他磁盘更容易损坏。
- RAID 5:将校验数据螺旋式写入所有磁盘
- RAID 6: 与RAID 5相似,但数据只写入N-2块磁盘,并将 校验数据螺旋式的写入在2块磁盘中
四、如何存储
- 升级计算机 -------------------垂直伸缩
- 升级CPU、内存、磁盘----水平伸缩