如果固态硬盘白菜价,如果内存便宜量又足,我们还要磁盘干什么?
硬件的发展日新月异,真的是日新月异,做存储系统的人忙活很久处理磁盘随机IO的问题,结果几万次IOPS的SSD出来了,结果还有几十万次IOPS的Fusion IO也有了。存储系统一定得跟得上时代的发展。好马配好鞍,好硬件也要好软件来发挥其能力。
对于存储系统来说,这个时代是SSD的时代,是内存的时代。新的数据库都想发挥这些新的高速硬件的性能,那么这是不是意味着磁盘就快要终结了?
信息时代,信息膨胀的速度谁晓得不是比宇宙膨胀的速度还快。互联网公司建立网页,获取用户信息,记录用户的每一次点击,甚至用户鼠标所有的滑动轨迹都不想落下。内部的系统也不断分析产生更多的数据。这些数据都在急剧的膨胀,需要数据库来容纳这些数据,同时还得能提供查询和分析的功能。
磁盘在什么地方还能发挥作用呢?分级存储。计算机体系架构里的磁盘->内存->高速缓存的架构的形成源于数据使用频度的不同。在数据库里也是这样,虽然数据存得越来越多,但总会有的数据访问的多,有的数据访问的少。一般来说,新数据总是被查询得更多,旧数据就要少很多,越旧的数据查询越少。这时磁盘就发挥了作用,虽然性能不如其他,但是让它存访问的少的数据就好了。在公司内,完成功能的同时,总要考虑成本因素。SATA磁盘比SAS磁盘便宜,SAS磁盘比SSD便宜,SSD比内存便宜,自然而然的就形成了存储的体系架构,需要的是存储系统识别出不同数据的访问频度,在合适的时间把数据放在适当的地方。
很多应用里,人们已经这么做了,常见的是把热的数据放到内存里当缓存,冷数据会长期存在数据库的硬盘里。淘宝的CDN系统做得更彻底,一个好的调度算法,把冷热程度不同的数据分别存放到SATA磁盘、SAS磁盘和SSD中,将所有硬件的特性都发挥了出来。新的数据库系统,需要考虑这样的应用需求,在系统设计上,就考虑多介质混合存储,记录数据的访问热度,自动均衡数据。
野百合也有春天,磁盘也没到末日。但是,历史的车轮是往前转的,碾碎谁,留住谁,历史知道。