大数据助力组织转型与事件日志异常行为修复
事件日志异常行为修复
在过程挖掘中,输入数据往往包含异常(噪声和罕见)行为,这会导致挖掘结果不准确或不可用。为解决这一问题,提出了一种修复事件日志的方法。
过滤方法虽然能取得较好结果,但通常需要移除大量事件日志中的行为。以下是最佳过程模型在不同事件日志中剩余轨迹的百分比:
| 事件日志 | 噪声百分比:0 | 噪声百分比:5 | 噪声百分比:10 | 噪声百分比:20 | 噪声百分比:50 |
| — | — | — | — | — | — |
| 序列 | 100 | 95 | 90 | 81 | 52 |
| 异或 | 100 | 95 | 90 | 42 | 52 |
| 并行 | 100 | 52 | 48 | 41 | 23 |
| 循环 | 100 | 95 | 90 | 80 | 51 |
| 全部 | 83 | 95 | 90 | 9 | 5 |
| 高变体 | 100 | 95 | 90 | 81 | 20 |
从表格中可以看出,在某些情况下,最佳过程模型仅通过 5% 的轨迹就能被发现,这意味着需要从事件日志中移除大量行为。而修复方法则会保留所有轨迹,但可能会对其进行修改。
修复方法使用控制流导向的上下文模式的出现频率,以及不同子序列出现在其中间的概率来检测异常行为。如果该概率低于给定阈值,则根据上下文将子序列替换为更可能出现的子序列。以下是该方法的流程:
graph LR
A[输入事件日志] --> B[计算上下文模式频率和
超级会员免费看
订阅专栏 解锁全文
883

被折叠的 条评论
为什么被折叠?



