Trie + AC自动机

目录

Trie 字典树

AC自动机


Trie 字典树

  1. 进行快速的查找字符串是否存在
  2. 进行快速的字符串的前缀和的相关的性质的查询

建立

struct Trie{
    int ch[maxn][30];
    int tot;    //总结点个数
    int cnt[maxn];  //是否为单词
    
    void init(){
        tot = 0;
        memset(ch, -1, sizeof ch);
        memset(cnt, 0, sizeof cnt);
    }
};

插入单词

void insert(char* str){
    int p = 0;
    for(int i=0; str[i]; ++i){
        if(ch[p][str[i] - 'a'] == -1)
            ch[p][str[i] - 'a'] = ++ tot;
        p = ch[p][str[i] -'a'];
    }
    cnt[p] ++;
}

查询

int find(char* str){
    int p = 0;
    for(int i=0; str[i]; ++i){
        if(ch[p][str[i] - 'a'] == -1)
            return 0;
        p = ch[p][str[i] - 'a'];
    }
    return cnt[p];
}

删除某个单词

void erase(char* str){
    int p = 0;
    for(int i=0; str[i]; ++i){
        if(ch[p][str[i] - 'a'] == -1)
            return;
        p = ch[p][str[i] - 'a'];
    }
    if(cnt[p])  -- cnt[p];  //是单词,不是前缀节点
}

字典树上的动态规划

void find(char* str, int st){
    int p = 0;
    for(int i=st; str[i]; ++i){
        if(ch[p][str[i] - 'a'] == -1)    return;
        p = ch[p][str[i] - 'a'];
        if(cnt[p])    dp[i] += dp[st - 1];
    }
}

 


AC自动机

  • KMP 算法可以用来处理单个串的匹配,而 AC 自动机则是处理多个串的匹配。
  • 也就是,给你许多个字符串的集合 ? 和一个长字符串 ?,问 你 ? 有几个子串是 ? 中的。(可以具体到哪几个、可以求出每个 子串出现了几次)

建完Trie字典树后,建失配边

last[ ]:沿着失配边到达的下一个单词结束节点

#define SIGMA_SIZE 26
#define root 0
void getFail(){
    queue<int> q;
    fail[0] = 0;
    for(int c=0; c<SIGMA_SIZE; ++c){
        int u = ch[0][c];
        if(u != -1){
            fail[u] = 0;
            last[u] = 0;
            q.push(u);
        }
        else 
            fail[u] = 0;    //补齐缺失的边
    }
    
    while(!q.empty()){
        int r = q.front();
        q.pop();
        for(int c=0; c<SIGMA_SIZE; ++c){
            int u = ch[r][c];
            if(u == -1){
                ch[r][c] = ch[fail[r]][c];      //补齐缺失的边
                continue;
            }
            q.push(u);
            int v = fail[r];
            while(v != -1 && ch[v][c] != -1)
                v = fail[v];
            fail[u] = ch[v][c];     //失配边
            last[u] = cnt[fail[u]]? fail[u]: last[fail[u]];
        }
    }
}
      

查询

int find(char* str){
    int n = strlen(str);
    int tmp = root, res = 0;
    for(int i=0; str[i]; ++i){
        tmp = ch[tmp][str[i] - 'a'];
        while(tmp != root){
            res += cnt[tmp];
            tmp = last[tmp];    //last[ ]保证是单词结束节点的失配边都访问
        }
    }
    return res;
}

 

在IT领域,尤其是地理信息系统(GIS)中,坐标转换是一项关键技术。本文将深入探讨百度坐标系、火星坐标系和WGS84坐标系之间的相互转换,并介绍如何使用相关工具进行批量转换。 首先,我们需要了解这三种坐标系的基本概念。WGS84坐标系,即“World Geodetic System 1984”,是一种全球通用的地球坐标系统,广泛应用于GPS定位和地图服务。它以地球椭球模型为基础,以地球质心为原点,是国际航空和航海的主要参考坐标系。百度坐标系(BD-09)是百度地图使用的坐标系。为了保护隐私和安全,百度对WGS84坐标进行了偏移处理,导致其与WGS84坐标存在差异。火星坐标系(GCJ-02)是中国国家测绘局采用的坐标系,同样对WGS84坐标进行了加密处理,以防止未经授权的精确位置获取。 坐标转换的目的是确保不同坐标系下的地理位置数据能够准确对应。在GIS应用中,通常通过特定的算法实现转换,如双线性内插法或四参数转换法。一些“坐标转换小工具”可以批量转换百度坐标、火星坐标与WGS84坐标。这些工具可能包含样本文件(如org_xy_格式参考.csv),用于提供原始坐标数据,其中包含需要转换的经纬度信息。此外,工具通常会附带使用指南(如重要说明用前必读.txt和readme.txt),说明输入数据格式、转换步骤及可能的精度问题等。x86和x64目录则可能包含适用于32位和64位操作系统的软件或库文件。 在使用这些工具时,用户需要注意以下几点:确保输入的坐标数据准确无误,包括经纬度顺序和浮点数精度;按照工具要求正确组织数据,遵循读规则;注意转换精度,不同的转换方法可能会产生微小误差;在批量转换时,检查每个坐标是否成功转换,避免个别错误数据影响整体结果。 坐标转换是GIS领域的基础操作,对于地图服务、导航系统和地理数据分析等至关重要。理解不同坐标系的特点和转换方法,有助于我们更好地处
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值