基于完整性、精确性和简单性引导的流程发现遗传算法
在过去十年中,不同应用领域都在大力发展流程自动化执行技术。然而,实际执行的流程和预先设计的流程可能存在差异,因此需要流程挖掘(PM)技术来获取流程执行的真实信息。流程挖掘技术通常利用日志文件,可分为流程发现、一致性检查和增强等不同类别,本文重点关注流程发现问题,即控制流发现,旨在从事件日志中检索出能代表实际行为的流程模型。
目前已有许多流程发现的相关工作,大多数算法基于Petri网,可根据应用的技术类型进行分类:
- 抽象算法 :通常能得到简单模型,但完整性较差。
- 启发式算法 :对噪声有较强的鲁棒性,但不能保证完整性的最优结果,且无法同时处理所有常见结构。
- 搜索算法 :部分技术能保证模型的合理性,但不一定能得到完整模型;部分能处理所有不同的主要行为,但忽略了简单性。
- 基于区域理论的算法 :虽能保证模型的完整性,但无法处理噪声和所有不同的模式结构。
为了克服现有算法的不足,本文提出了ProDiGen算法,它是一种流程发现算法,使用了考虑完整性、精确性和简单性的分层适应度函数,并采用启发式方法优化遗传算子。该算法已通过21个不平衡日志进行测试,并与两种最先进的流程挖掘技术进行了比较。
ProDiGen算法
ProDiGen算法受Genetic Miner启发,但与之存在一些差异,如下表所示:
| 比较项 | ProDiGen | Genetic Miner |
| ---- | ---- | -
超级会员免费看
订阅专栏 解锁全文
2425

被折叠的 条评论
为什么被折叠?



