基于内在维度的启发式方法在形状分类和检索中减少循环DTW比较次数
1. 引言
形状分类和检索在工业、医学、生物识别甚至娱乐等多个领域都有重要应用。解决该问题的方法中,动态时间规整(DTW)相关方法以及多维度轮廓描述符的使用较为突出。这些形状描述符旨在获取轮廓上每个点的所有信息,因此规模较大。虽然它们能提供全面的描述,且DTW作为一种相异度度量具有能对齐部分而非点、对弹性变形鲁棒等优点,但计算成本较高。此外,还存在起始点不变性的问题,即需要确定序列比较的起始位置。目前虽有多种启发式方法来解决该问题,但大多不适用。因此,通常需要对序列的每个可能起始点进行比较,这就引出了循环序列和循环动态时间规整(CDTW)的需求。
计算CDTW的算法虽能降低成本,但对于高维形状描述符,序列组件间的局部距离对最终成本影响较大。所以在识别任务中,需避免对数据库中所有原型进行CDTW计算,即避免穷举搜索。
近似消除搜索算法(AESA)能大幅减少距离计算,但CDTW不满足三角不等式,不是度量距离,无法直接使用AESA。不过此前有研究在不满足三角不等式的情况下使用AESA加速基于DTW的语音识别任务取得了不错的结果。本文在此基础上,引入内在维度这一重要因素改进启发式方法,是高维循环序列形状分类和检索中避免穷举搜索的唯一替代方案。
2. 内在维度与最近邻
基于度量的索引方法并非适用于所有数据库和度量,其效率受数据库距离分布的影响。从该分布可得到内在维度,给定数据库D和度量m,内在维度ϱ的计算公式为:ϱ(D, m) = μ² / (2σ²),其中μ和σ²分别是距离分布的均值和方差。
研究表明,基于度量的算法会随着维度增加而系统地退化,计算成本接近穷举
超级会员免费看
订阅专栏 解锁全文
3354

被折叠的 条评论
为什么被折叠?



