快速多维近似模式匹配
1. 引言
近似模式匹配旨在允许字符出现错误(插入、删除、替换)的情况下,在文本中查找模式。这一问题在众多领域都有重要应用,如文本搜索、模式识别、计算生物学、音频处理等。二维带错误的模式匹配可用于计算机视觉,例如在大图像中搜索子图像;三维的相关算法则可用于视频数据或某些医疗数据(如 MRI 脑部扫描)的容错搜索。
在一维情况下,该问题常用编辑距离建模。编辑距离 ed(a, b) 指的是将字符串 a 转换为 b 所需的最少编辑操作(插入、删除、替换)次数。经典的近似模式匹配问题是:给定长度为 n 的文本和长度为 m 的模式,二者均为大小为 σ 的字母表 Σ 上的序列,找出文本中与模式的编辑距离至多为 k ( 0 < k < m )的所有片段。经典解法采用动态规划,时间复杂度为 O(mn) 。
Krithivasan 和 Sitalakshmi(KS)提出了一种简单的二维扩展方法。对于相同大小的两个图像,编辑距离定义为对应行图像编辑距离之和。这种定义适用于按行传输且通信错误较少的图像,但在其他情况下并不合适。他们使用该模型解决了在大小为 n × n 的大图像中搜索大小为 m × m 的子图像的近似搜索问题,时间复杂度为 O(m²n²) 。
Baez
超级会员免费看
订阅专栏 解锁全文
56

被折叠的 条评论
为什么被折叠?



