基于趋势聚类的克里金插值在传感器数据网络中的应用
1 引言
无线传感器网络正逐渐成为监测物理现象(如天气、污染、交通等)的重要工具。每个传感器节点都具备计算和存储能力,其使用寿命取决于能源的合理使用。然而,应用环境的不确定性以及通信和传输带宽的限制,使得我们需要采用网络中有意义的子集来估计未采样的值。
传感器的高空间密度虽然能提供更多数据、更高分辨率和更好的准确性,但同时也会增加通信和处理的需求。为了减少通信和能源需求,我们可以尽可能减少传输传感器的数量,同时保持合理的数据准确性。本文将使用克里金(Kriging)技术和趋势聚类发现来估计空间中任何未采样位置以及过去任何时间点的未知数据。
缺乏信息的原因主要有以下几点:
1. 传感器在一段时间内产生了大量数据,但由于存储设备的限制,无法全部存储以供未来分析。
2. 传感器因节能或损坏而未产生数据(数据缺失)。
3. 指定位置没有传感器,但我们仍希望估计该位置的感测值(新数据)。
插值是解决信息缺乏问题的自然方法,它基于已知数据和数据相关模型来估计未知数据。数据相关模型的选择会影响插值的准确性,由于传感器数据受空间和时间排列的影响,因此在确定数据相关模型时,需要考虑传感器在网络中的时空排列。
传统的插值技术很少同时考虑空间和时间信息,在之前的工作中,有人提出使用趋势聚类来模拟传感器数据的时空动态,并使用反距离加权(IDW)技术进行数据估计。本文将以克里金技术为基础进行插值,克里金通过线性组合附近数据来估计未知位置的值,具有无偏性和最小化残差误差方差的优点。但将克里金技术应用于传感器网络时,计算变异函数的成本较高,且由于概念漂移,变异函数可能随时间变化,因此需要在每