空间数据挖掘的方法与技术
1. 模糊集
模糊集基于模糊隶属函数处理空间数据挖掘(SDM)中的模糊性,该函数描述不确定概率。模糊性是客观存在的,系统越复杂,准确描述就越困难,模糊性也就越大。在SDM中,类和对象分别被视为模糊集和元素,每个对象被赋予在类中的隶属度。若感兴趣的全域中有许多边界不明确的对象,一个对象可能会被赋予一组隶属度。隶属度越接近1,元素属于该类的可能性就越大。例如,图像中有土壤、河流和植被时,一个像素会被赋予三个隶属度。类的不确定性主要源于主观假设和客观模糊性。由于没有明确定义的边界,模糊集更适合对具有地理不确定性空间异质分布的数据进行模糊分类。
模糊综合评价和模糊聚类分析是模糊集的两个基本技术,将它们集成到SDM中发现知识的步骤如下:
1. 模糊集为每个影响因素获取模糊评价矩阵。
2. 所有模糊评价矩阵乘以相应的权重矩阵,其乘积矩阵即为所有因素的综合矩阵。
3. 综合矩阵进一步用于创建模糊相似矩阵,在此基础上得到模糊等价矩阵。
4. 通过提出的最大余数算法进行模糊聚类。
然而,当确定模糊隶属度后,后续计算会舍弃本应持续传播到最终结果的模糊性。此外,由于模糊集仅关注模糊不确定性,当SDM中存在多种不确定性(如随机性和模糊性)时,它可能会失效。
2. 粗糙集
粗糙集通过上下近似处理SDM中的不完整性,是一种基于不完整性的推理方法,通过刻画确定性和不确定性来创建决策表。粗糙集由上近似集和下近似集组成,分类对象的标准是在给定全域中信息是否充分。下近似集中具有必要信息的对象肯定属于该类,全域中但在上近似集之外且没有必要信息的对象肯定不属于该类。上近似集和下近似集之间的差集是不确定边界,其中
超级会员免费看
订阅专栏 解锁全文
2887

被折叠的 条评论
为什么被折叠?



