AC自动机

本文介绍了一种用于多模板串匹配文本串的高效算法——Aho-Corasick自动机(AC自动机),它是KMP算法与Trie树的结合。文中详细解释了AC自动机的工作原理,包括构建Trie树、获取失配指针及文本串匹配等三个核心环节,并提供了具体的实现代码。

Aho-Corasick automaton是一种用于多模板串匹配文本串的算法。是KMP算法与Trie树的结合。

来看一个经典的例子,要求在一段文字中找到给定单词列表中的所有单词,你会怎么办?可以对每个单词跑一遍KMP,但是复杂度极高。比较好的做法是用AC自动机。

AC自动机可以认为是将多个模板串建成Trie树,然后利用KMP的“失配指针”思想,去匹配文本串。

根据上面说的,AC自动机有3个主要环节。一、建Trie树。这和建普通的Trie树基本没有区别。二、得到每个非根结点的失配指针。先将所有的fail指针初始化为指向根结点。对于根结点的孩子,让其fail指针指向根结点即可。除此之外,每个结点的fail指针由其父亲的fail指针得到,即fail[ch[u][i]]=ch[fail[u]][i];但是,如果其父亲的fail指针指向的结点没有和当前结点代表字符一样的孩子,又该怎么办呢?可以从一开始就让那些指向不存在的孩子的指针去指向该结点的fail指针指向结点的对应孩子。相当于简化了过程,你发现接下来“无路可走”了,那么就去到最近的“有路可走”处,最多也就回到根结点。三、匹配文本串。我们按照文本串,在Trie树上走,每走到一个结点,都会再去不断沿着fail指针到根结点,将途中遇到的匹配统计下来。比如,匹配到了she,那么同时也匹配到了he。

 1 struct AC_automaton {
 2     int ch[maxn][maxc],fail[maxn],cnt[maxn],num;
 3     //与Trie树相比只是多了fail数组
 4     AC_automaton() {
 5         memset(ch,-1,sizeof(ch)); //ch全部初始化为-1
 6         memset(fail,0,sizeof(fail));
 7         memset(cnt,0,sizeof(cnt));
 8         num=0;
 9     }
10     void insert(char* s) {
11         int u=0;
12         for(int i=0;s[i];++i) {
13             if(ch[u][s[i]-'a']==-1) ch[u][s[i]-'a']=++num;
14             u=ch[u][s[i]-'a'];
15         }
16         ++cnt[u]; //插入和Trie树基本相同
17     }
18     void build() { //建立失配指针
19         queue<int> q; //BFS
20         for(int i=0;i<maxc;++i) { //根节点特殊处理
21             if(ch[0][i]==-1) ch[0][i]=0;
22             else q.push(ch[0][i]);
23         }
24         while(!q.empty()) {
25             int u=q.front();q.pop();
26             for(int i=0;i<maxc;++i) {
27                 if(ch[u][i]==-1) ch[u][i]=ch[fail[u]][i]; //没有这个孩子,则可以让其向上找
28                 else {
29                     fail[ch[u][i]]=ch[fail[u]][i]; //孩子的失配指针由父亲得到
30                     q.push(ch[u][i]);
31                 }
32             }
33         }
34     }
35     int count(char* s) { //统计文本串中出现过多少次模板串(可重复)
36         int u=0,ans=0;
37         for(int i=0;s[i];++i) {
38             u=ch[u][s[i]-'a'];
39             int tmp=u;
40             while(tmp) { //不断向上找
41                 ans+=cnt[tmp];
42                 // cnt[tmp]=0;
43                 //加上这一句代表在文本串中出现过多少个模板串(不重复)
44                 tmp=fail[tmp];
45             }
46         }
47         return ans;
48     }
49 };

 

转载于:https://www.cnblogs.com/Mr94Kevin/p/9664993.html

多角色体系 支持管理员、商家、消费者三种角色,权限分级管控: 管理员:负责平台整体配置、用户审核、数据监控等全局操作。 商家:管理店铺信息、发布商品、处理订单、回复评价等。 消费者:浏览商品、加入购物车、下单支付、评价商品等。 实现用户注册(手机号 / 邮箱验证)、登录(支持密码 / 验证码 / 第三方登录)、个人信息管理(头像、收货地址、密码修改)。 权限精细化控制 商家仅能管理自家店铺及商品,消费者仅能查看和购买商品,管理员拥有全平台数据访问权限。 二、商品管理功能 商品信息维护 商家可发布商品:填写名称、分类(如服饰、电子产品)、子类别(如手机、笔记本)、规格(尺寸、颜色、型号)、价格、库存、详情描述(图文)、物流信息(运费、发货地)等。 支持商品上下架、库存调整、信息编辑,系统自动记录商品状态变更日志。 商品分类与搜索 按多级分类展示商品(如 “数码产品→手机→智能手机”),支持自定义分类体系。 提供智能搜索功能:按关键词(名称、品牌)搜索,支持模糊匹配和搜索联想;结合用户浏览历史对搜索结果排序(优先展示高相关度商品)。 商品推荐 基于用户浏览、收藏、购买记录,推荐相似商品(如 “浏览过该商品的用户还买了…”)。 首页展示热门商品(销量 TOP10)、新品上架、限时折扣等推荐列表。 三、订单与交易管理 购物车与下单 消费者可将商品加入购物车,支持修改数量、选择规格、移除商品,系统自动计算总价(含运费、折扣)。 下单流程:确认收货地址→选择支付方式(在线支付、货到付款)→提交订单→系统生成唯一订单号。 订单处理流程 订单状态跟踪:待支付→已支付→商家发货→物流运输→消费者收货→订单完成,各状态变更实时通知用户。 商家端功能:查看新订单提醒、确认发货(填写物流单号)、处理退款申请(需审核理由)。 消费者端功能:查看订单详情、追踪物流、申请退款 / 退货、确认收货。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值