基于趋势聚类的克里金插值在传感器数据网络中的应用
1. 引言
无线传感器网络正逐渐成为监测物理现象的重要工具,如天气、污染、交通等。每个传感器节点都具备计算和存储能力,其寿命取决于能源的合理利用。然而,传感器网络在数据采集过程中面临诸多挑战,例如节点断电、时间同步错误、干扰、网络传输故障、传感器硬件问题或通信能耗过高等,这些问题导致信息获取困难。
一方面,提高传感器密度可以获取更多数据、更高分辨率和更准确的结果,但这需要更多的通信和处理资源。另一方面,传感器可能由于内存限制、主动关闭或损坏、特定位置无传感器等原因,无法提供完整信息。因此,我们需要一种有效的方法来估计未采样位置和时间点的数据。
为了解决这些问题,本文研究了一种数据挖掘方法,结合克里金(Kriging)技术和趋势聚类发现,以减少通信和能源需求,同时保持合理的数据准确性。
2. 问题提出与基本概念
2.1 传感器数据网络模型
采用快照模型来表示传感器网络连续产生的随机字段 $Z$ 的数据。每个传感器测量的数据与二维空间点(如经纬度)地理参考,并标记时间戳。在时间 $t_i$ 的快照 $D(t_i)$ 是一组具有时间戳的数据,可通过随机字段函数 $Z(·)$ 的时间戳离散化表示。
传感器网络数据流 $D$ 是一系列连续的时间戳快照:
$D = D(t_1), D(t_2), … D(t_i), …)$ (1)
在基于计数的窗口模型中,数据流被分解为连续的 $w$ 个快照窗口。当一个窗口完成后,进行分析并可选择丢弃或存储数据。
以下是传感器数据网络模型的关键信息表格:
| 模型