大数据的存储

本文深入探讨了大数据存储的核心问题,包括数据容量、读写速度及可靠性。从单机时代的RAID到分布式文件系统的变迁,详细解析了RAID0、RAID1、RAID10、RAID3、RAID5和RAID6等不同级别的特性与应用场景,以及计算机系统通过垂直伸缩和水平伸缩来应对大规模数据存储挑战的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、对于大数据的存储

  • 单机时代-------------------- RAID
  • 分布式时代 -----------------分布式文件系统

二、大规模数据存储的核心问题

  1. 数据容量问题
  2. 数据读写速度问题
  3. 数据可靠问题

三、RAID(Redundant Arrays of Independent Drives)

  1. RAID 0 :速度快,但不做数据备份。无数据冗余的的存储空间条带化,数据在从内存缓冲区写入磁盘时,根据磁盘数量将数据分为N份,这些数据同时并发写入N块磁盘。
  2. RAID 1: 可靠性高。使用磁盘镜像(Disk mirroing)技术,将一份数据同时写入两块磁盘。
  3. RAID 10: 提高可靠性,改善性能。将N块磁盘平均分成两份,在每一份磁盘中采用RAID 0技术将数据同时存入两份磁盘,相当于RAID 1。
  4. RAID 3:将数据并发写入N-1块磁盘,并在第N块磁盘记录效验数据,导致第N块磁盘比其他磁盘更容易损坏。
  5. RAID 5:将校验数据螺旋式写入所有磁盘
  6. RAID 6: 与RAID 5相似,但数据只写入N-2块磁盘,并将 校验数据螺旋式的写入在2块磁盘中

四、如何存储

  1. 升级计算机 -------------------垂直伸缩
  2. 升级CPU、内存、磁盘----水平伸缩
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值