空间数据挖掘(SDM)知识全解析
1. SDM基础原理
SDM主要针对具有众多属性的对象进行处理。数据集越具普遍性,其特征就越抽象。例如,基于特征的数据约简是对空间对象的一种抽象,通过大幅降低维度和减少数据处理量来实现。基于特征,以属性为基础的对象点可以自由分布,进而形成多个对象组,同一组内的对象通常具有相同的特征。随着数据的逐步泛化,数据集会按特征进行总结,同时对象在特征空间中的分布也会发生变化。不同的分布会导致不同的对象组成,甚至会出现重新组合的情况。这种组合会根据发现任务中的不同特征而有所变化。
从属性空间跃迁至特征空间时,基于属性的对象点会被总结为基于特征的对象点或聚类。当进一步从微观特征空间跃迁至宏观特征空间时,对象点会被划分为更具概括性的聚类。特征会变得越来越通用,直至发现知识(即聚类知识)。
2. 概念空间
当在SDM中使用概念时,概念空间可以从属性空间或特征空间中生成。客观世界包含物理对象,而主观世界则反映了物理对象与人类认知之间的内外联系特征。从主观对象的存在到自我意识的存在,每一次思维活动都针对特定的对象。概念是对象的演化和流动过程,与外部背景相关联。
当大量数据分布在概念空间中时,各种概念就会应运而生。显然,概念比数据更直接、更易于理解。各种概念反映了意图和外延,共同构成了概念空间。概念空间中的所有数据都对某个概念有贡献,这种贡献与数据和概念之间的距离以及数据的值有关,数据的值越大,其贡献就越大。
给定一组具有相同属性或特征范围的定量数据,如何泛化和表示定性概念是知识发现的基础。通过以各种方式组合和重新组合基本概念,认知事件可以进一步揭示知识。在概念空间中,用于总结对象数据集的各种概念呈现出不同
超级会员免费看
订阅专栏 解锁全文
2216

被折叠的 条评论
为什么被折叠?



