DRain:基于结果质量驱动的流程数据分析引擎
1 引言
智慧城市范式的出现给信息通信技术(ICT)带来了诸多新挑战。大城市产生的海量多样数据(即大数据)的分析,再结合多个领域专家和利益相关者分散的需求,变得极具挑战性。例如,智慧城市中的城市规划任务需要收集从能源消耗、建筑和交通系统到社会因素等各重要领域的数据。
虽然工作流已用于组合和执行一系列计算或数据操作步骤,如科学工作流,但很少有讨论聚焦于利用运行时机制,根据用户定义的结果质量(QoR)来选择和配置数据感知流程,以执行分布式数据分析。在某些场景中,大量的数据感知流程变体与数据服务交互,每个都有特定的质量约束。因此,由于数据感知分析流程和数据端点的高度可变性,在运行时提供质量驱动的流程选择和定制手段至关重要。
1.1 动机、贡献和文章结构
在基于流程的数据分析中,实际执行流程活动所需的数据比典型的流程相关数据更广泛。原始数据(如来自数据 API 的数据)虽与多个工件(如服务和流程活动)相关,但不绑定特定意图,代表一般信息。而远程分析流程和可用服务的结果可作为特定意图数据提供,以数据即服务(DaaS)的形式展示预期结果。
服务包括领域专家的计算模型(如 MATLAB 模型),这些是流程执行活动所必需的。数据感知分析流程,即工作流即服务(WFaaS),代表了行业利益相关者的特定意图。这种流程逻辑以流程模型(如 BPMN2、BPEL)的形式表示,代表特定的分析类型,由一系列要执行的活动组成。因此,根据用户意图请求创建流程实例,该请求可能表明所需的 QoR。
由于相关流程和数据的高度可变性,需要将 WFaaS 的选择和配置推迟到运行时,根据 QoR 定制和执行流程变体。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



