看动画学算法系列之:后缀数组suffix array

本文介绍了后缀数组的概念,定义及其与后缀树的比较。通过动画演示了后缀数组的创建流程,包括倍增算法的详细步骤,并讲解了如何在后缀数组中查找特定字符串。此外,还探讨了如何构建LCP(最长公共前缀)数组。后缀数组作为模式匹配工具,因其简单和节省空间而被广泛用于信息学竞赛。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

在之前的文章中,我们讲到了后缀树和它的一些特性。后缀树主要用来做模式匹配中,比如全文索引,寻找公共前缀等,非常的有用。同样的后缀数组和后缀树的作用非常类似,和后缀树相比,后缀数组更简单并且更加节省空间,今天我们将会详细介绍下后缀数组的特性和使用。

后缀数组的定义

后缀数组和后缀树一样都是一个单词所有后缀的集合。只不过后缀数组把所有的后缀按照字母的顺序进行排序。

我们还是举之前的BANANA的例子,我们给这个单词一个加上一个后缀 $ , 假设 $ 按字母表排序是排在最上面的。那么我们的所有后缀如下图所示:

按照字母顺序排序之后生成的后缀数组如下:

先按首字母排序,如果首字母相同则第二个,以此类推。

后缀数组的创建流程

构造后缀数组一般有两种方法:倍增算法和DC3算法。

这里我们详细的介绍一下怎么使用倍增算法来构建后缀数组。

回到我们上面提到的初始化状态和排序完成状态的两张图。

先介绍初始状态的图,图中我们定义了几个变量,分别是i,SA[i],Su

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

flydean程序那些事

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值