空间数据挖掘:从数据到知识的升华之路
1. 网络环境下的空间数据挖掘
网络是一个巨大的分布式并行信息空间和宝贵的信息源。它提供了丰富的网络平台资源,包括网络设备、接口资源、计算和带宽资源、存储资源以及网络拓扑结构。同时,各种数据资源以网络平台为载体,如文本、声音、视频数据、网络软件和应用软件等。
网络技术的飞速发展为广泛的空间信息共享、合成和知识发现提供了新的机遇。然而,如何利用这些分布式、自主、异构的数据资源及时获取、形成和使用所需的知识,是一个亟待解决的问题。借助网络,空间数据集可以突破本地限制,不仅利用部门内部的数据,还能利用更大范围甚至整个空间领域或相关领域的所有空间数据,从而使发现的知识更具意义。但由于网络固有的开放性、分布式、动态性和异构性,用户难以准确、快速地获取所需信息。
Web 挖掘是从与互联网相关的人工制品或活动中提取有用模式和隐含信息的过程。它主要包括以下几种类型:
| Web 挖掘类型 | 描述 |
| — | — |
| Web 内容挖掘 | 从基于网络的数据、文档和页面或其描述中发现知识。 |
| Web 结构挖掘 | 从网站的结构和不同网站之间的拓扑关系中揭示知识。 |
| Web 使用挖掘 | 提取 Web 用户的行为,或对用户如何使用和与 Web 交互进行建模和预测。 |
其中,从网络上的文本资源中提取新的、前所未有的知识是一个很有前景的挖掘领域,空间数据挖掘(SDM)就是其中之一。此外,互联网文本挖掘算法和基于信息的 Web 服务器日志数据挖掘研究也越来越受到关注。为了适应网络的分布式计算环境,SDM 系统需要在架构和数据存储模式上进行变革,在分布式计算平台上提供不同层次的空
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



