继续翻老底--罗穗骞的后缀数组代码注释

本文深入探讨了一种高效的字符串处理技术——后缀数组(SA)的构建算法。该算法适用于处理大规模文本数据,通过使用计数排序和倍增策略实现了后缀排序,并计算了高度数组,有助于后续的字符串匹配和模式发现任务。

这几天想要写一篇尽可能总结到我的思想和方法论的一篇文章,目前写了5000多字,结果到了第3天突然发烧,还好一个熬了一个晚上就好了。结果是最近完全没有做出可以发博客的东西,只能翻一翻老底,贴一下我之前读代码的注释了。

//coder:OX_louis
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <vector>
#include <queue>
#include <set>
#include <map>
#include <string>
#include <cmath>
#include <cstdlib>
#include <ctime>
#include <stack>
using namespace std;
typedef long long ll;
typedef pair<int, int> pii;
const int maxn = 1005;

int wa[maxn],wb[maxn],wv[maxn],_ws[maxn],sa[maxn];
int cmp(int *r,int a,int b,int l){
    return r[a]==r[b]&&r[a+l]==r[b+l];
}

void da(char *r,int *sa,int n,int m){//n为字符串长度,m为字符的取值范围,传入的r为一开始的数组。
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) _ws[i]=0;//计数的辅助数组
    for(i=0;i<n;i++) _ws[x[i]=r[i]]++;//_ws统计每个i的rank出现的次数。x复制r
    for(i=1;i<m;i++) _ws[i]+=_ws[i-1];//_ws从头开始累加。
    for(i=n-1;i>=0;i--) sa[--_ws[x[i]]]=i;//注意这里从后往前以保证排序的稳定性。
    //针对x[i]的计数排序,得到的是长度为1的后缀数组。
    //x[i]此时可以视为rank数组,初始rank值就是数值本身,不需要是精确的rank,能比较就行。
    for(j=1,p=1;p<n;j*=2,m=p){//j是倍增的长度,假如第一关键字下标是x,那么第二关键字下标就是x+j,反过来如果第二关键字的下标是sa[i],则第一关键字的下标就是sa[i]-j。
        for(p=0,i=n-j;i<n;i++) y[p++]=i;//y存储的是对第二关键字的排序结果,可以理解为y[p]就是第二关键字第p大的字符的下标,因为倍增时在n-j及之后的元素找不到第二关键字,故排在排序结果的前列
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;//i从0开始往后遍历,sa(i)的字典序不断增大,以此保证y是升序的
        for(i=0;i<n;i++) wv[i]=x[y[i]];//按第二关键字的大小顺序从头到尾排列的数组,数组中存储的是关键字的rank值,wv[i]可看作排序后的x[i];
        for(i=0;i<m;i++) _ws[i]=0;//计数的辅助数组
        for(i=0;i<n;i++) _ws[wv[i]]++;//此处wv与x值域相同,只是遍历的顺序不同,按照第二关键字的大小顺序进行遍历。
        for(i=1;i<m;i++) _ws[i]+=_ws[i-1];//计数排序的常规步骤
        for(i=n-1;i>=0;i--) sa[--_ws[wv[i]]]=y[i];//这里的i是名次,y[i]才是下标。sa[i]是综合了第一第二关键字排序后第i大的下标。
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)//交换x,y后,用新的x数组保存rank值。为了保证相同元素rank值相同需要遍历
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;//与上一项相同则采用上一项的rank值,否则采用新rank值。
        //循环后x[i]恒为rank数组,y[i]恒为下标数组
    }
    return;
}

int rnk[maxn],height[maxn];
void calheight(char *r, int n){           //  求height数组。
    int i, j, k = 0;
    for(i = 1; i <= n; i ++) rnk[sa[i]] = i; // 1->n
    for(i = 0; i < n; i++){
        for(k ? k -- : 0, j = sa[rnk[i]-1]; r[i+k] == r[j+k]; k ++);//利用性质求height数组,sa[rnk[i]]比sa[rnk[i]-1]的height-1,这样复杂度为O(n)
        height[rnk[i]] = k;
    }
}

int main(){
    char s[maxn];
    int is[maxn];
    scanf("%s",s);
    int l = strlen(s)+1;
    da(s,sa,l,128);//128是字符范围,ASCII码最多从0-127
    calheight(s,l-1);
    for(int i=0;i<=strlen(s);i++){
        cout<<sa[i]<<' '<<height[i]<<' '<<&s[sa[i]]<<endl;
    }
    return 0;
}



欧姆龙FINS(工厂集成网络系统)协议是专为该公司自动化设备间数据交互而设计的网络通信标准。该协议构建于TCP/IP基础之上,允许用户借助常规网络接口执行远程监控、程序编写及信息传输任务。本文档所附的“欧ronFins.zip”压缩包提供了基于C与C++语言开发的FINS协议实现代码库,旨在协助开发人员便捷地建立与欧姆龙可编程逻辑控制器的通信连接。 FINS协议的消息框架由指令头部、地址字段、操作代码及数据区段构成。指令头部用于声明消息类别与长度信息;地址字段明确目标设备所处的网络位置与节点标识;操作代码定义了具体的通信行为,例如数据读取、写入或控制器指令执行;数据区段则承载实际交互的信息内容。 在采用C或C++语言实施FINS协议时,需重点关注以下技术环节: 1. **网络参数设置**:建立与欧姆龙可编程逻辑控制器的通信前,必须获取控制器的网络地址、子网划分参数及路由网关地址,这些配置信息通常记载于设备技术手册或系统设置界面。 2. **通信链路建立**:通过套接字编程技术创建TCP连接至控制器。该过程涉及初始化套接字实例、绑定本地通信端口,并向控制器网络地址发起连接请求。 3. **协议报文构建**:依据操作代码与目标功能构造符合规范的FINS协议数据单元。例如执行输入寄存器读取操作时,需准确配置对应的操作代码与存储器地址参数。 4. **数据格式转换**:协议通信过程中需进行二进制数据的编码与解码处理,包括将控制器的位状态信息或数值参数转换为字节序列进行传输,并在接收端执行逆向解析。 5. **异常状况处理**:完善应对通信过程中可能出现的各类异常情况,包括连接建立失败、响应超时及错误状态码返回等问题的处理机制。 6. **数据传输管理**:运用数据发送与接收函数完成信息交换。需注意FINS协议可能涉及数据包的分割传输与重组机制,因单个协议报文可能被拆分为多个TCP数据段进行传送。 7. **响应信息解析**:接收到控制器返回的数据后,需对FINS响应报文进行结构化解析,以确认操作执行状态并提取有效返回数据。 在代码资源包中,通常包含以下组成部分:展示连接建立与数据读写操作的示范程序;实现协议报文构建、传输接收及解析功能的源代码文件;说明库函数调用方式与接口规范的指导文档;用于验证功能完整性的测试案例。开发人员可通过研究这些材料掌握如何将FINS协议集成至实际项目中,从而实现与欧姆龙可编程逻辑控制器的高效可靠通信。在工程实践中,还需综合考虑网络环境稳定性、通信速率优化及故障恢复机制等要素,以确保整个控制系统的持续可靠运行。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值