目标、空间、多媒体、文本和 Web 数据挖掘
在数据挖掘领域,对不同类型的数据进行挖掘是一个重要的研究方向。本文将介绍计划挖掘技术、空间数据挖掘、多媒体数据挖掘等方面的内容。
1. 计划挖掘技术
计划挖掘技术采用分治策略,先通过对计划库进行多维泛化,找到有趣、高层次的简洁计划序列,再根据挖掘出的模式对计划库进行划分,以发现子计划库的相应特征。这种挖掘方法可应用于许多其他领域,如 Web 日志挖掘,可先研究 Web 的一般访问模式,识别热门 Web 门户和常见路径,再深入挖掘详细的从属模式。
计划挖掘技术还可在多个方面进一步发展:
- 使用类似关联规则挖掘中的最小支持阈值,确定泛化级别,确保模式覆盖足够多的案例。
- 探索计划挖掘中的其他运算符,如“小于”。
- 从子序列中提取关联,或挖掘涉及多维属性的序列模式,如涉及机场大小和位置的模式。
2. 空间数据挖掘
2.1 空间数据库特点
空间数据库存储大量与空间相关的数据,如地图、预处理的遥感或医学影像数据以及 VLSI 芯片布局数据。与关系数据库相比,空间数据库具有许多独特的特征,它携带拓扑和/或距离信息,通常由复杂的多维空间索引结构组织,通过空间数据访问方法进行访问,并且经常需要空间推理、几何计算和空间知识表示技术。
2.2 空间数据挖掘的定义和应用
空间数据挖掘指的是从空间数据库中提取未明确存储的知识、空间关系或其他有趣模式。这需要将数据挖掘与空间数据库技术相结合,可用于理解空间数据、发现空间关系以及空间与非空间数据之间的关系、构建空间知识库、重组空间数据库和优化空间查询。它在地理信息系统