HDU 5129 Yong Zheng's Death

本文介绍了一种解决字符串组合问题的算法,通过构建Trie树和AC自动机,有效地计算由字符串前缀组成的唯一字符串数量,避免重复计数。

题目链接:HDU-5129

题目大意为给一堆字符串,问由任意两个字符串的前缀子串(注意断句)能组成多少种不同的字符串。

思路是先用总方案数减去重复的方案数。

考虑对于一个字符串S,如图,假设S1,S2,S3,S4,S5,S6均为前缀。

换言之,对于这种字符串,我们计算了三次。

发现,重复的方案数,等于中间如图有颜色的方块的数量。所以我们要做的也就是计数像图中有颜色的小方块的数量。

我们可以通过遍历像S6一样的字符串的数量,来计算重复的方案数。S6满足以下条件:

  1. 存在一个前缀S4为S6的后缀,且S4为S6的最长的“是前缀的”后缀(保证是小方块间没有隔板)。
  2. S6-S4为某个前缀的后缀(在图中为S3的后缀)。

我们发现,对于某一个S6,其对应的S4时一定的。

我们用sum[S]表示以S为后缀的前缀字符串的数量。

这样,当我们遍历S6,对于每一个S6,我们找到其对应的S4后,只要减去( sum[S6-S4] - 1 )即可。

所以我们要处理的,就是以下两个问题:

  1. 如何找到S6对应的S4
  2. 如何求sum[S]

这时候,我们发现S6与S4的关系,和AC自动机的性质很像。S6在失配时跳到的位置就是S4。于是第一个问题解决了。

对于第二个问题,我们同样可以通过AC自动机找到。具体的参见代码。

 

  1 #include<cstring>
  2 #include<cstdio>
  3 #include<queue>
  4 using namespace std;
  5 
  6 typedef long long LL;
  7 const LL MAXN=300010;
  8 const LL SIGMA_SIZE=26;
  9 struct Trie
 10 {
 11     LL ch[MAXN][SIGMA_SIZE];
 12     LL fa[MAXN];
 13     LL sz;                                              //节点总数
 14     Trie() { sz=1; fa[0]=-1; memset(ch[0],0,sizeof(ch[0])); }
 15     LL idx(char c) { return c-'a'; }                     //节点c的编号
 16     void clear() { sz=1; fa[0]=-1; memset(ch[0],0,sizeof(ch[0])); }
 17 
 18     //在Trie中插入字符串s
 19     void insert(char *s)
 20     {
 21         LL u=0,n=strlen(s);
 22         for(LL i=0;i<n;i++)
 23         {
 24             LL c=idx(s[i]);
 25             if(!ch[u][c])                                //节点不存在
 26             {
 27                 memset(ch[sz],0,sizeof(ch[sz]));
 28                 fa[sz]=u;
 29                 ch[u][c]=sz++;                            //新建节点
 30             }
 31             u=ch[u][c];                                    //往下走
 32         }
 33     }
 34 
 35     //AC自动机部分
 36     LL f[MAXN];
 37     LL deg[MAXN];                            
 38     LL sum[MAXN];                             //sum[i]表示以Si为后缀的前缀的数量
 39     void getFail()
 40     {
 41         queue<LL> q;
 42         f[0]=0;
 43         //初始化队列
 44         for(LL c=0;c<SIGMA_SIZE;c++)
 45         {
 46             LL u=ch[0][c];
 47             if(u) { f[u]=0; q.push(u); }
 48         }
 49         //按BFS顺序计算失配函数
 50         while(!q.empty())
 51         {
 52             LL r=q.front(); q.pop();
 53             for(LL c=0;c<SIGMA_SIZE;c++)
 54             {
 55                 LL u=ch[r][c];
 56                 if(!u) { ch[r][c]=ch[f[r]][c]; continue; }
 57                 q.push(u);
 58                 LL v=f[r];
 59                 f[u]=ch[v][c];
 60             }
 61         }
 62         for(LL i=1;i<sz;i++) { deg[i]=0; sum[i]=1; }
 63         for(LL i=1;i<sz;i++) deg[f[i]]++;
 64         queue<LL> Q;
 65         for(LL i=1;i<sz;i++) if(!deg[i]) Q.push(i);
 66         while(!Q.empty())
 67         {
 68             LL u=Q.front(); Q.pop();
 69             sum[f[u]]+=sum[u];
 70             deg[f[u]]--;
 71             if(!deg[f[u]]) Q.push(f[u]);
 72         }
 73     }
 74 
 75     void solve()
 76     {
 77         LL tot=0;
 78         for(LL i=1;i<sz;i++) if(f[i])
 79         {
 80             LL j=f[i];
 81             LL p=i;
 82             while(j)
 83             {
 84                 p=fa[p];
 85                 j=fa[j];
 86             }
 87             tot+=sum[p]-1;
 88         }
 89         printf("%lld\n",1LL*(sz-1)*(sz-1)-tot);
 90     }
 91 };
 92 Trie T;
 93 int main()
 94 {
 95 #ifdef LOCAL
 96     freopen("in.txt","r",stdin);
 97 #endif
 98     LL n;
 99     while(scanf("%lld",&n) && n)
100     {
101         scanf("%lld",&n);
102         for(LL i=1;i<=n;i++)
103         {
104             char s[50];
105             scanf("%s",s);
106             T.insert(s);
107         }
108         T.getFail();
109         T.solve();
110         T.clear();
111     }
112     return 0;
113 }

 

转载于:https://www.cnblogs.com/zarth/p/6606730.html

一、数据采集层:多源人脸数据获取 该层负责从不同设备 / 渠道采集人脸原始数据,为后续模型训练与识别提供基础样本,核心功能包括: 1. 多设备适配采集 实时摄像头采集: 调用计算机内置摄像头(或外接 USB 摄像头),通过OpenCV的VideoCapture接口实时捕获视频流,支持手动触发 “拍照”(按指定快捷键如Space)或自动定时采集(如每 2 秒采集 1 张),采集时自动框选人脸区域(通过Haar级联分类器初步定位),确保样本聚焦人脸。 支持采集参数配置:可设置采集分辨率(如 640×480、1280×720)、图像格式(JPG/PNG)、单用户采集数量(如默认采集 20 张,确保样本多样性),采集过程中实时显示 “已采集数量 / 目标数量”,避免样本不足。 本地图像 / 视频导入: 支持批量导入本地人脸图像文件(支持 JPG、PNG、BMP 格式),自动过滤非图像文件;导入视频文件(MP4、AVI 格式)时,可按 “固定帧间隔”(如每 10 帧提取 1 张图像)或 “手动选择帧” 提取人脸样本,适用于无实时摄像头场景。 数据集对接: 支持接入公开人脸数据集(如 LFW、ORL),通过预设脚本自动读取数据集目录结构(按 “用户 ID - 样本图像” 分类),快速构建训练样本库,无需手动采集,降低系统开发与测试成本。 2. 采集过程辅助功能 人脸有效性校验:采集时通过OpenCV的Haar级联分类器(或MTCNN轻量级模型)实时检测图像中是否包含人脸,若未检测到人脸(如遮挡、侧脸角度过大),则弹窗提示 “未识别到人脸,请调整姿态”,避免无效样本存入。 样本标签管理:采集时需为每个样本绑定 “用户标签”(如姓名、ID 号),支持手动输入标签或从 Excel 名单批量导入标签(按 “标签 - 采集数量” 对应),采集完成后自动按 “标签 - 序号” 命名文件(如 “张三
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值