9、云计算中基于模型驱动的自动化错误恢复

云计算中基于模型驱动的自动化错误恢复

1. 云计算与错误恢复挑战

云计算将计算从本地设备转移到分布式、虚拟和可扩展的资源,使用户能够按需使用计算、存储和其他应用资源。以 Amazon EC2 为例,它允许用户在云中部署定制应用,按使用的时间和存储付费。

然而,随着云中运行节点数量的增加,潜在故障点和错误恢复的复杂性也相应增加。云应用可能面临从硬件故障到操作员错误等各种问题,例如 Amazon EC2 对硬件或虚拟机(VM)实例的可用性和可靠性保证有限。

传统的手动错误恢复方式存在诸多挑战:
- 难以准确定位大量运行应用实例中的错误。
- 检测和定位错误可能耗时过长,导致长时间服务中断或错误传播。
- 涉及多个或复杂修改操作时,错误恢复耗时且易出错。
- 缺乏日志功能,难以跟踪过去的恢复操作,恢复可能不可靠。
- 关键错误恢复知识可能集中在少数人手中,人员变动时会出现问题。

2. 基于模型的自动化错误恢复方法

为解决上述问题,提出了一种基于分布式应用状态的高级图形模型的自动化错误恢复方法。

首先,开发特定领域建模语言(DSML)来定义云应用的运行状态。DSML 通常是图形化的特定领域语言,支持比通用语言更高层次的抽象,可构建运行时模型,作为反映应用运行节点和状态的图形监控界面。当云中出现错误时,模型也会反映出来,并且纠正模型中的错误会触发云中相应的更改。

但通过修改运行时模型进行错误恢复仍然是手动过程,存在可扩展性、生产力、知识集中和可重复性等问题。因此,引入了“通过演示进行恢复”(Recovery by Demonstration)的方法,该方法源

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值