全文检索(hdu1277,字典树,ac自动机)

本文介绍了一种使用字典树(Trie)进行高效全文检索的方法,通过构建字典树并遍历文本,实现了对关键字的有效查找。文章详细解释了字典树的插入和查找操作,并提供了一个具体的编程实现示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

全文检索

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 2346    Accepted Submission(s): 794

 

Problem Description

我们大家经常用google检索信息,但是检索信息的程序是很困难编写的;现在请你编写一个简单的全文检索程序。
问题的描述是这样的:给定一个信息流文件,信息完全有数字组成,数字个数不超过60000个,但也不少于60个;再给定一个关键字集合,其中关键字个数不超过10000个,每个关键字的信息数字不超过60个,但也不少于5个;两个不同的关键字的前4个数字是不相同的;由于流文件太长,已经把它分成多行;请你编写一个程序检索出有那些关键字在文件中出现过。

Input

第一行是两个整数M,N;M表示数字信息的行数,N表示关键字的个数;接着是M行信息数字,然后是一个空行;再接着是N行关键字;每个关键字的形式是:[Key No. 1] 84336606737854833158。

Output

输出只有一行,如果检索到有关键字出现,则依次输出,但不能重复,中间有空格,形式如:Found key: [Key No. 9] [Key No. 5];如果没找到,则输出形如:No key can be found !。

Sample Input


 

20 10 646371829920732613433350295911348731863560763634906583816269 637943246892596447991938395877747771811648872332524287543417 420073458038799863383943942530626367011418831418830378814827 679789991249141417051280978492595526784382732523080941390128 848936060512743730770176538411912533308591624872304820548423 057714962038959390276719431970894771269272915078424294911604 285668850536322870175463184619212279227080486085232196545993 274120348544992476883699966392847818898765000210113407285843 826588950728649155284642040381621412034311030525211673826615 398392584951483398200573382259746978916038978673319211750951 759887080899375947416778162964542298155439321112519055818097 642777682095251801728347934613082147096788006630252328830397 651057159088107635467760822355648170303701893489665828841446 069075452303785944262412169703756833446978261465128188378490 310770144518810438159567647733036073099159346768788307780542 503526691711872185060586699672220882332373316019934540754940 773329948050821544112511169610221737386427076709247489217919 035158663949436676762790541915664544880091332011868983231199 331629190771638894322709719381139120258155869538381417179544 000361739177065479939154438487026200359760114591903421347697

[Key No. 1] 934134543994403697353070375063

[Key No. 2] 261985859328131064098820791211

[Key No. 3] 306654944587896551585198958148

[Key No. 4] 338705582224622197932744664740

[Key No. 5] 619212279227080486085232196545

[Key No. 6] 333721611669515948347341113196

[Key No. 7] 558413268297940936497001402385

[Key No. 8] 212078302886403292548019629313

[Key No. 9] 877747771811648872332524287543

[Key No. 10] 488616113330539801137218227609

 

Sample Output


 

Found key: [Key No. 9] [Key No. 5]

 

逆向建图,从key里找原文,遍历每个开头的可能

ac:

#include<bits/stdc++.h>
using namespace std;

int trie[1000005][10]={0};///表示编号为i的节点的第j个孩子是编号为k的节点。
int vis[1000005]={0};
int vis1[1000005]={0};
int pos=1,m,n,k,l;

void insert1(int x,char ctr[])
{
    int rt=0;
    int l=strlen(ctr);
    for(int i=0;i<l;i++)
    {
        int id=ctr[i]-'0';
        if(trie[rt][id]==0)
            trie[rt][id]=++pos;
        rt=trie[rt][id];
    }
    vis[rt]=x;
}

int find1(char ctr[])
{
    int rt=0,flag=0;
    int l=strlen(ctr);
    for(int i=0;i<60;i++)
    {
        int id=ctr[i]-'0';
        if(trie[rt][id]==0)
        {
            if(vis[rt]==0&&vis1[rt]!=1)
                flag=1;
            break;
        }
        rt=trie[rt][id];
    }
    if(flag==0)
    {
        printf(" [Key No. %d]",vis[rt]);
        vis1[rt]=1;
    }
}

char ctr[60005]={0},str[60005]={0},tmp[61]={0};

int main()
{
    std::ios::sync_with_stdio(false);
    scanf("%d%d",&m,&n);
    for(int i=0;i<m;i++)
    {
        scanf("%s",&ctr);
        l=strlen(ctr);
        for(int i=0;i<l;i++)
            str[k++]=ctr[i];
    }
    for(int i=1;i<=n;i++)
    {
        scanf("%s",&tmp);
        scanf("%s",&tmp);
        scanf("%s",&tmp);
        scanf("%s",&tmp);
        insert1(i,tmp);
    }
    printf("Found key:");
    for(int i=0;i<k;i++)
        find1(str+i);
    printf("\n");    
    return 0;
}

简单的字典树

我不知道为什么呢个m和n用cin就错,用scanf就对,搞不懂

刚刚问了学长:

std::ios::sync_with_stdio(false);

取消了ios和stdin的同步,就不能混用两种流了

不能既用cin又用scanf printf

 

 

 

 

 

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值