粒度知识发现框架:火灾救援事件数据报告系统案例研究
1. 引言
国家消防救援部门通常配备事件数据报告系统(IDRS)来收集行动信息。然而,现有的 IDRS 大多仅停留在简单报告层面,缺乏对救援行动风险和物流相关领域知识的建模,也无法以有意义的方式组织和分析数据。
语义驱动的数据组织,即粒度化,对于分析既有数据支持又易于用户理解的事件至关重要。利用领域知识构建具有语义和统计意义的粒度,是创建复杂现实世界现象模型的关键,这一过程可称为粒度知识发现。
本文提出扩展波兰版 IDRS(EWID),使其能从大量半结构化运营报告中提取有用知识。领域知识在数据清洗和转换中发挥重要作用,如检测和处理异常值、定义有意义的特征等。
2. 平台设计动机
知识发现过程与 KDD 阶段(选择、预处理、转换、数据挖掘、解释/评估)一致,且在每个阶段都需与专家密切互动。
专家在解决问题时,并非简单选择重要特征,而是使用抽象数据表示。例如,专家可能会提及类似事件组、房屋密度或重型设备等数据库中不存在的属性,对于时间也会使用自己的量化方式,如“下午”或“清晨”。
因此,基于领域知识的模型需要操作抽象数据以匹配专家的表示,这促使了粒度层的创建。粒度层的抽象概念需从原始数据层推导而来,但原始数据存在质量问题,缺乏语义信息,因此引入了质量数据层。这样,平台形成了自然的多层结构,顶层为模型层。
以下是平台的分层结构:
| 层次 | 描述 |
| ---- | ---- |
| 原始数据层 | 收集来自各种来源的数据 |
| 质量数据层 | 包含高质量数据,解决原始数据的质量问题 |
超级会员免费看
订阅专栏 解锁全文
79

被折叠的 条评论
为什么被折叠?



