65、轻量级虚拟机检查点与回滚:保障长时间运行应用的高效执行

轻量级虚拟机检查点与回滚:保障长时间运行应用的高效执行

1. 引言

在当今的数据中心中,机器虚拟化技术得到了广泛应用。应用程序不再运行在物理机上,而是被封装到虚拟机(VM)中,这种隔离的计算模式为应用提供了独立的运行环境。例如,Raddit、Netflix、Airbnb 等知名网站都运行在 Amazon EC2 提供的虚拟机上,Emulab 则为科学计算应用提供了可扩展的平台。

然而,数据中心通常使用不可靠的商用设备,故障成为常态而非例外。服务器崩溃、网络中断和软件挂起等不可预测的底层故障,可能导致虚拟机崩溃,进而造成应用程序中断。对于长时间运行的应用,如科学计算或图像处理,频繁的故障可能导致中间结果丢失,使应用无法完成。

检查点/回滚是一种提高系统可用性的有效技术。它在无故障执行期间定期将应用程序的运行状态保存到持久存储中。发生故障时,系统可以从之前记录的状态恢复,从中间状态继续执行,减少计算损失。对于长时间运行的应用来说,这项技术能防止中间结果丢失,确保应用在一定时间内完成。

但检查点/回滚本身会给应用执行时间带来额外开销,主要体现在停机时间(Downtime)和持续时间(Duration)上。停机时间是指虚拟机在进行检查点或回滚操作时必须暂停的时间,这会直接增加应用执行时间。持续时间则与保存或恢复整个虚拟机状态所需的时间有关,在此阶段应用性能会下降,完成任务所需时间增加。由于虚拟机内存状态较大,保存或恢复整个内存映像需要更多的 IO 资源和时间,导致停机时间和持续时间都很显著。

为了解决这些问题,本文提出了 warmCR,这是一种轻量级的检查点和回滚系统,旨在保证长期应用完成的同时,尽量减少自身对执行时间的开销。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值