空间数据挖掘(SDM)的瓶颈与应对策略
1. 空间数据挖掘概述
现实世界的空间是一个多参数、非线性且时变的不确定系统,可通过各种空间数据进行观测和描述。空间数据具有空间性、时间性、多维性、海量性、复杂性和不确定性等特点,能够识别地球上空间实体的地理特征、边界和关系。虽然空间数据挖掘(SDM)已取得了一些研究和应用成果,但仍面临诸多技术难题。
2. SDM面临的瓶颈
2.1 过量的空间数据
随着遥感(RS)、数字技术、网络、多媒体和图像技术的快速发展,空间数据的数量、规模、复杂性和传输速度都在迅速增长,其增长速度远远超过传统事务数据。例如,EOS - AM1(Terra)和EOS - PM1(Aqua)每天产生的传感数据就超过太比特级别。传统的数据处理方法,如枚举法,在面对大量空间数据时往往无能为力。解决这一问题需要数据挖掘(DM)能够在用户定义的发现任务下,通过数据集样本总结和理解数据总体。
2.2 高维空间数据
空间数据的增长不仅体现在水平实例上,还体现在垂直属性上。为了在计算机世界中准确完整地描绘空间实体,需要观测更多类型的属性。数字地球的空间数据基础设施包含图像、图形、数字地形模型(DTMs)、交通网络、河流系统和实体边界等多种属性,且数据来源广泛。此外,空间实体之间或属性之间存在各种空间或非空间关系,这些都增加了数据的维度和规模。然而,当前的空间信息系统(GIS)难以描述多维结构中的地理元素,对多维数据集的分析和掌握存在困难,严重制约了地理空间信息科学的发展。在高维数据库中发现知识时,还面临着如何有效组织和存储多维元素、快速搜索和检索目标数据、大幅降低维度以及清晰总结多维知识等挑战。
超级会员免费看
订阅专栏 解锁全文
1459

被折叠的 条评论
为什么被折叠?



