字符串顺序匹配(相似度) php <一>

在处理地址信息提取任务时,遇到各种格式的地址,如浙江杭州江干区等。尝试了字符匹配度和字符串包含等方法效果不佳。受到文章启发,采用回溯的字符串模式匹配方法,编写了一段PHP代码,成功解决问题。分享学习过程,期待交流指正。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

刚来公司要从地址信息中提取籍贯,手头有地区代码表
例如:浙江省杭州市江干区xx路xx号,或者浙江杭州江干xx路xx号,反正千奇百怪的地址花样,
要把江干区提取出来
试着用过字符匹配度,字符串包含等方法效果不甚理想
无意间浏览到了jianghuihong2012大神关于[回溯的字符串模式匹配]文章,然后自己发散了一下思维,有了下面这段代码

<?php
function strmatch($str,$model){
    $i=0;
    $j=0;
    $num = 0;
    $res =array(0);                  //空数组预先存入一个0,防止max()报错
    while($i<strlen($str)){             //$model的第一个字符和$str从第一个字符挨个比对
           if($str[$i]!=$model[$j]){    //如果  不相等j依旧等于0,一直停留在当前位置 i++ 直至相等或者跳出循环
                                        //如果不相等则$model 跳回第一个字符 j = 0 ,$str跳回 i+1-$num$num=0,继续比对
               $j=0;
               $i+=1-$num;
               $num = 0;
           }else{                       //如果相等,(1)$num++,两个字符串都移向下一位i++ j++,$num 存入数组 如果相等继续(1$j++;
               $i++;
               $num++;
               $res[]=$num;
           }
            if ($num==strlen($model)){  //如果$model已经100%相似了,则跳出循环
                break;
            }
    }
        return max($res);                //返回$model$str顺序最大相似度
}

        $str1 = "sdfsgdkg";                 //实例
        $str2 = "sgd";
        echo strmatch($str1,$str2);

输出:这里写图片描述

菜鸟一只,为记录学习过程,也为与各位交流,欢迎大神们指正交流

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值