HDU 2222 Keywords Search(AC自动机)

Keywords Search

Problem Description
In the modern time, Search engine came into the life of everybody like Google, Baidu, etc.
Wiskey also wants to bring this feature to his image retrieval system.
Every image have a long description, when users type some keywords to find the image, the system will match the keywords with description of image and show the image which the most keywords be matched.
To simplify the problem, giving you a description of image, and some keywords, you should tell me how many keywords will be match.
 

Input
First line will contain one integer means how many cases will follow by.
Each case will contain two integers N means the number of keywords and N keywords follow. (N <= 10000)
Each keyword will only contains characters 'a'-'z', and the length will be not longer than 50.
The last line is the description, and the length will be not longer than 1000000.
 

Output
Print how many keywords are contained in the description.
 

Sample Input
  
1 5 she he say shr her yasherhs
 

Sample Output
  
3
 
    PS: 很久之前就想开AC自动机,一直没狠下心来去搞,今天晚上虽说昏昏沉沉的度过,不过还是慢慢的啃懂了AC自动机的最简单用法。用一道AC自动机比较经典的例题来当模板吧,还有如果你想很快的学会的话推荐一个博客【 AC自动机】去认真的看,相信你也很快就会懂哒!不过要提前学会字典树和KMP噢。
    回归正题:
    【例题题意】
            题意很简单,首先给定n个长度不超过50的要查找字符串,最后一行给出一个模式串。问在模式串中出现了多少个待查找字符串,有坑点是这n个字符串中可能会有重复的。
    【解决方法】
            盲目的跑n遍KMP不知道可行不可行,不过算了一下极限复杂度是绝对要炸的。
            那么这时候就用到AC自动机了,AC自动机用通俗的话来说就是多个数据结构放在了一起,这次是KMP+字典树而已,如果你已经学会了KMP,相信你理解AC自动机中使用BFS建立每个节点的fail指针和最后查找字符串的时候就不会那么难了。
            具体的做法,我们先把给定的n个待查字符串以字典树的形式存储下来,以下是建立字典树的过程。
//建立字典树
char str[1000100];
struct node{
    int count;
    node *next[26]; 
    node *fail;
    void init(){          //初始化函数,这样写会节省大量代码量
        count = 0;        //因为n个待查字符串会有重复的,所以我们设立一个count来统计一下数量
        fail = NULL;
        for(int i=0;i<26;i++)
            next[i] = NULL;
    }
}*root;

void insert(char *str){  //传进来的str是每个待查找字符串
    int len = strlen(str);
    node *p = root;
    for(int i=0;i<len;i++){
        int pos = str[i] - 'a';
        if(p->next[pos] == NULL){
            p->next[pos] = new node;
            p->next[pos]->init();
            p = p->next[pos];
        }
        else
            p = p->next[pos];
    }
    p->count++;
}
            建好字典树之后,我们用bfs去更新字典树上每个节点的fail指针,fail指针中存储的是当p->next[pos]查找失败时应当跳转的指针p=p->fail.相当于KMP算法之中的next数组,只不过KMP算法的next数组以数组的形式存储了下来,这里我们用指针的形式存储下来,应当跳转的位置。
//构造失败指针(fail指针)
//其实这个过程很简单,我们归结为一句话
//设这个节点上的字母为C,沿着他父亲的失败指针走,直到走到一个特殊的节点,
//恰好这个特殊的节点的儿子中也有字母为C的节点。然后把当前节点的失败指针指向那个字母也
//为C的儿子。如果一直走到了root都没找到,那就把失败指针指向root
void Getfail(){
    node *p = root,*son,*temp;
    queue<node*>Q;                    //节点队列
    Q.push(p);
    while(!Q.empty()){
        temp = Q.front();Q.pop();
        for(int i=0;i<26;i++){
            son = temp->next[i];
            if(son != NULL){
                if(temp == root)   
                    son->fail = root; 
                else{
                    p = temp->fail;
                    while(p){
                        if(p->next[i]){
                            son->fail = p->next[i];
                            break;
                        }
                        p = p->fail;
                    }
                    if(p == NULL)     //一直找到最后为NULL了还没找到,就直接指向root
                        son->fail = root;
                }
                Q.push(son);          //每更新了一个节点,把这个节点存到队列里,方便去更新它的子孙节点
            }
        }
    }
}
            直到fail指针(即失败指针)建立好之后,最后只剩下去匹配了,他是怎么匹配的呢?我们看代码。
//查找模式串
int cal_ans(){
    //Getfail();
    int len = strlen(str),num = 0;
    node *p,*temp;
    p = root;
    for(int i=0;i<len;i++){             //遍历模式串
        int pos = str[i] - 'a';
        while(!p->next[pos] && p!=root) //将fail指针指到最后有特殊的节点的节点
            p = p->fail;
        p = p->next[pos];               
        if(p == NULL)
            p = root;
        temp = p;
        while(temp!=root){
            if(temp->count>0){         //如果count大于0,更新答案,并删掉count值
                num += temp->count;
                temp->count = 0;
            }
            else
                break;
            temp = temp->fail;         //遍历他所有的失败节点,即以当前字母作为结尾的所有答案
        }
    }
    return num;
}
          如果你还没有看明白的话,请手动画图,把例题的样例的字典树画在纸上,然后模拟上述代码,半个小时之内你就会明白AC自动机的所有知识点。如果再不明白,去我上面给的博客,他有已经做好的例图,结合他说的过程,你就会明白啦!

AC Code
#include <algorithm>
#include <iostream>
#include <numeric>
#include <cstring>
#include <iomanip>
#include <string>
#include <vector>
#include <cstdio>
#include <queue>
#include <stack>
#include <cmath>
#include <map>
#include <set>
#define LL long long
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
const LL M = 100099;
const double esp = 1e-6;
const double PI = 3.14159265359;
const LL INF = 0x3f3f3f3f;
using namespace std;
//建立字典树
char str[1000100];
struct node{
    int count;
    node *next[26]; 
    node *fail;
    void init(){          //初始化函数,这样写会节省大量代码量
        count = 0;        //因为n个待查字符串会有重复的,所以我们设立一个count来统计一下数量
        fail = NULL;
        for(int i=0;i<26;i++)
            next[i] = NULL;
    }
}*root;

void insert(char *str){  //传进来的str是每个待查找字符串
    int len = strlen(str);
    node *p = root;
    for(int i=0;i<len;i++){
        int pos = str[i] - 'a';
        if(p->next[pos] == NULL){
            p->next[pos] = new node;
            p->next[pos]->init();
            p = p->next[pos];
        }
        else
            p = p->next[pos];
    }
    p->count++;
}
//构造失败指针(fail指针)
//其实这个过程很简单,我们归结为一句话
//设这个节点上的字母为C,沿着他父亲的失败指针走,直到走到一个特殊的节点,
//恰好这个特殊的节点的儿子中也有字母为C的节点。然后把当前节点的失败指针指向那个字母也
//为C的儿子。如果一直走到了root都没找到,那就把失败指针指向root
void Getfail(){
    node *p = root,*son,*temp;
    queue<node*>Q;                    //节点队列
    Q.push(p);
    while(!Q.empty()){
        temp = Q.front();Q.pop();
        for(int i=0;i<26;i++){
            son = temp->next[i];
            if(son != NULL){
                if(temp == root)   
                    son->fail = root; 
                else{
                    p = temp->fail;
                    while(p){
                        if(p->next[i]){
                            son->fail = p->next[i];
                            break;
                        }
                        p = p->fail;
                    }
                    if(p == NULL)     //一直找到最后为NULL了还没找到,就直接指向root
                        son->fail = root;
                }
                Q.push(son);          //每更新了一个节点,把这个节点存到队列里,方便去更新它的子孙节点
            }
        }
    }
}
//查找模式串
int cal_ans(){
    Getfail();
    int len = strlen(str),num = 0;
    node *p,*temp;
    p = root;
    for(int i=0;i<len;i++){             //遍历模式串
        int pos = str[i] - 'a';
        while(!p->next[pos] && p!=root) //将fail指针指到最后有特殊的节点的节点
            p = p->fail;
        p = p->next[pos];               
        if(p == NULL)
            p = root;
        temp = p;
        while(temp!=root){
            if(temp->count>0){         //如果count大于0,更新答案,并删掉count值
                num += temp->count;
                temp->count = 0;
            }
            else
                break;
            temp = temp->fail;         //遍历他所有的失败节点,即以当前字母作为结尾的所有答案
        }
    }
    return num;
}
int main(){
    int t,n;
    scanf("%d",&t);
    while(t--){
        root = new node;
        root->init();
        scanf("%d",&n);
        for(int i=0;i<n;i++){
            scanf("%s",str);
            insert(str);
        }
        scanf("%s",str);
        printf("%d\n",cal_ans());
    }
    return 0;
}



基于数据挖掘的音乐推荐系统设计与实现 需要一个代码说明,需要论文 采用python语言,django框架,mysql数据库开发 编程环境:pycharm,mysql8.0 系统分为前台+后台模式开发 网站前台: 用户注册, 登录 搜索音乐,音乐欣赏(可以在线进行播放) 用户登陆时选择相关感兴趣的音乐风格 音乐收藏 音乐推荐算法:(重点) 本课需要大量用户行为(如播放记录、收藏列表)、音乐特征(如音频特征、歌曲元数据)等数据 (1)根据用户之间相似性或关联性,给一个用户推荐与其相似或有关联的其他用户所感兴趣的音乐; (2)根据音乐之间的相似性或关联性,给一个用户推荐与其感兴趣的音乐相似或有关联的其他音乐。 基于用户的推荐和基于物品的推荐 其中基于用户的推荐是基于用户的相似度找出相似相似用户,然后向目标用户推荐其相似用户喜欢的东西(和你类似的人也喜欢**东西); 而基于物品的推荐是基于物品的相似度找出相似的物品做推荐(喜欢该音乐的人还喜欢了**音乐); 管理员 管理员信息管理 注册用户管理,审核 音乐爬虫(爬虫方式爬取网站音乐数据) 音乐信息管理(上传歌曲MP3,以便前台播放) 音乐收藏管理 用户 用户资料修改 我的音乐收藏 完整前后端源码,部署后可正常运行! 环境说明 开发语言:python后端 python版本:3.7 数据库:mysql 5.7+ 数据库工具:Navicat11+ 开发软件:pycharm
MPU6050是一款广泛应用在无人机、机器人和运动设备中的六轴姿态传感器,它集成了三轴陀螺仪和三轴加速度计。这款传感器能够实时监测并提供设备的角速度和线性加速度数据,对于理解物体的动态运动状态至关重要。在Arduino平台上,通过特定的库文件可以方便地与MPU6050进行通信,获取并解析传感器数据。 `MPU6050.cpp`和`MPU6050.h`是Arduino库的关键组成部分。`MPU6050.h`是头文件,包含了定义传感器接口和函数声明。它定义了类`MPU6050`,该类包含了初始化传感器、读取数据等方法。例如,`begin()`函数用于设置传感器的工作模式和I2C地址,`getAcceleration()`和`getGyroscope()`则分别用于获取加速度和角速度数据。 在Arduino项目中,首先需要包含`MPU6050.h`头文件,然后创建`MPU6050`对象,并调用`begin()`函数初始化传感器。之后,可以通过循环调用`getAcceleration()`和`getGyroscope()`来断更新传感器读数。为了处理这些始数据,通常还需要进行校准和滤波,以消除噪声和漂移。 I2C通信协议是MPU6050与Arduino交互的基础,它是一种低引脚数的串行通信协议,允许多个设备共享一对数据线。Arduino板上的Wire库提供了I2C通信的底层支持,使得用户无需深入了解通信细节,就能方便地与MPU6050交互。 MPU6050传感器的数据包括加速度(X、Y、Z轴)和角速度(同样为X、Y、Z轴)。加速度数据可以用来计算物体的静态位置和动态运动,而角速度数据则能反映物体转动的速度。结合这两个数据,可以进一步计算出物体的姿态(如角度和角速度变化)。 在嵌入式开发领域,特别是使用STM32微控制器时,也可以找到类似的库来驱动MPU6050。STM32通常具有更强大的处理能力和更多的GPIO口,可以实现更复杂的控制算法。然而,基本的传感器操作流程和数据处理理与Arduino平台相似。 在实际应用中,除了基本的传感器读取,还可能涉及到温度补偿、低功耗模式设置、DMP(数字运动处理器)功能的利用等高级特性。DMP可以帮助处理传感器数据,实现更高级的运动估计,减轻主控制器的计算负担。 MPU6050是一个强大的六轴传感器,广泛应用于各种需要实时运动追踪的项目中。通过 Arduino 或 STM32 的库文件,开发者可以轻松地与传感器交互,获取并处理数据,实现各种创新应用。博客和其他开源资源是学习和解决问的重要途径,通过这些资源,开发者可以获得关于MPU6050的详细信息和实践指南
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值