精准且富有表现力的修复时间预测模型发现方法
1. 引言
问题跟踪系统(也称为“故障/事件工单”系统)在实际协作环境中被广泛使用,用于管理、维护和解决组织或社区内出现的各种问题。在这样的背景下,一个重要的问题是预测修复时间,即解决一个问题所需的时间。
近年来,数据挖掘领域的一些研究工作已经开始关注这个问题,特别是在错误跟踪系统这个问题跟踪系统的热门子类中。然而,目前提出的方法主要是尝试从历史错误日志中归纳离散(即面向分类)或连续(即面向回归)的预测器,使用经典的命题预测方法,并且简单地将每个错误案例视为一个元组,编码错误最初报告时可用的所有信息,并标记一个离散或数值(目标)修复时间值。这就导致在错误/问题案例的整个生命周期中记录的所有数据(例如,其优先级、关键性、状态或分配人等属性的更改)都被完全忽略,尽管这些数据在运行时可能有助于细化(剩余)修复时间的预测。
预测性(状态感知)过程模型的发现是过程挖掘领域的一个新兴研究方向。但该领域开发的方法假设日志记录可以映射到明确指定的过程任务,而在实际的错误/问题系统中,日志通常只存储案例属性的更改序列,很难定义这样的任务。此外,不同的存储库即使基于同一平台开发(如Bugzilla),也往往具有异构的数据方案。
本文提出了一种新的方法,用于从低级别的错误/问题日志中发现(状态感知)修复时间预测模型,该方法可以充分利用以案例属性和属性修改记录形式存储的所有信息。为了在案例历史记录上达到合适的抽象级别,定义了一组模块化的参数化数据转换方法,将每个案例转换为一个过程跟踪(将更新记录抽象为高级活动),并可能用派生/聚合数据丰富这些跟踪。通过这种方式,可以获得一个高质量的面向过程的日志数据视图,使用预测性过程挖掘方法进行分析,最终诱导出一
超级会员免费看
订阅专栏 解锁全文

652

被折叠的 条评论
为什么被折叠?



