服务系统关键技术与平台创新解析
1 服务系统故障管理框架
1.1 故障管理需求与挑战
在面向服务的系统中,服务提供失败、服务级别协议(SLA)违规以及系统运行时环境的变化,都会对系统质量产生不利影响。现有的基于监控的举措大多支持静态分析,在解决不良变化和违规问题上能力有限,且主要侧重于帮助服务提供商避免 SLA 违规,而非协助服务消费者检测和应对有问题的服务质量。
1.2 故障管理方法概述
为解决上述问题,提出了一种基于消费者中心、可插拔经纪模型的故障管理方法。该方法独立于服务技术,支持不同的监控和协商模型,同时评估提供商声誉。此外,还引入了服务本体的可插拔支持,以实现协商和监控过程的自动化,并确保服务描述术语的一致性。
1.3 方法框架介绍
该方法基于一个可插拔的服务经纪框架,具体流程如下:
1. 模板提供 :服务消费者和提供商向经纪系统提供模板,分别说明所需或提供服务的策略。
2. 引擎构建 :经纪系统的引擎构建组件利用这些模板组装定制的服务代理引擎,用于处理协商消息和服务提案。
3. 提案生成与评估 :提案引擎创建并评估服务提案,代理引擎为每个支持的协商协议配备独立的协商引擎,可同时与多方进行协商。
4. 服务监控 :框架提供服务监控系统,采用被动模型透明地拦截服务请求和响应,实时监控协商服务的质量,检测突发变化、SLA 违规和故障。
以下是该框架的结构示意图: