业务流程偏差挖掘与事件日志可视化
业务流程偏差挖掘方法
业务流程偏差挖掘是识别业务流程中异常行为的重要手段,主要有基于相似性/聚类的方法、混合解决方案等。
基于相似性/聚类的方法
这类方法基于正常轨迹会出现在密集邻域或足够大的聚类中的假设,而不是使用行为模型来区分正常和偏差轨迹。具体可分为基于相似性的方法和基于聚类的方法。
- 基于相似性的方法
- kNN 方法 :一般基于 kNN(最近邻)的方法通过距离度量将每个对象与其邻居进行比较来检测异常值。在 Hsu 等人(2017)的研究中,距离度量是根据活动级持续时间和上下文信息定义的。具体操作步骤如下:
1. 以模糊方式表示上下文信息,并使用相关的隶属函数调整活动级持续时间。
2. 利用调整后持续时间的差异计算距离。
3. 最终使用 kNN 方案识别异常流程实例。
- 局部异常因子(LOF)方法 :Kang 等人(2012)采用 LOF 方法来发现具有异常终止的流程实例,该方法还可应用于流程的未来执行。
- 基于轮廓的偏差检测方法 :Li 和 van der Aalst(2017)提出了一种基于轮廓的偏差检测方法,具体步骤如下:
1. 根据动态修改的“规范”函数对主流案例集 CS 的初步版本进行采样,该函数偏向于“更正常”的案例。
2. 使用适当定义的“轮廓”函数计算每个日志案例与 CS 的相似度。
3. 将日志划分为正常案例集 CN 和偏差案例集 CD。
4. 调整规范
超级会员免费看
订阅专栏 解锁全文
1264

被折叠的 条评论
为什么被折叠?



