快速卷积及其在近似字符串匹配中的应用
1. 引言
在当前典型的 CPU 架构中,字长 ( w ) 通常为 32 或 64 位,并且有增长的趋势。在许多应用 FFT 和卷积的工作中,通常假设两个 ( w ) 位字的乘法可以在 ( O(1) ) 时间内完成,但对于较大的 ( w ) ,可能并非如此。若乘法需要 ( O(\log w) ) 时间,例如对于 ( k ) - 不匹配问题,结果将变为 ( O(n + n\sqrt{k \log w}/w \log k) ) 。
2. 向量打包的多重卷积
设有两个向量 ( \tau = \tau_0\tau_1 \cdots \tau_{n - 1} ) 和 ( \rho = \rho_0\rho_1 \cdots \rho_{m - 1} ) ,其中 ( m < n ) (通常 ( m \ll n ) )。我们关注以下形式的和:
[
S(i) = \rho \otimes \tau(i) = \sum_{j = 0}^{m - 1} \rho_j \times \tau_{i + j}
]
对于每个可能的 ( i ) 。使用 FFT(卷积定理),两个长度为 ( n ) 的向量的卷积需要 ( O(n \log n) ) 时间。若将 ( \tau ) 划分为 ( n/m ) 个重叠的块,每个块的长度为 ( 2m ) ,则计算每个 ( i ) 的 ( \rho \otimes \tau(i) ) 总共需要 ( O(n \log m) ) 时间。
为了并行计算多个卷积,假设 ( S(i) ) 的每个值可以用 ( u ) 位表示,那么每个 ( w ) 位的字(其中 ( w = \Om
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



