刚来公司要从地址信息中提取籍贯,手头有地区代码表
例如:浙江省杭州市江干区xx路xx号,或者浙江杭州江干xx路xx号,反正千奇百怪的地址花样,
要把江干区提取出来
试着用过字符匹配度,字符串包含等方法效果不甚理想
无意间浏览到了jianghuihong2012大神关于[回溯的字符串模式匹配]文章,然后自己发散了一下思维,有了下面这段代码
<?php
function strmatch($str,$model){
$i=0;
$j=0;
$num = 0;
$res =array(0); //空数组预先存入一个0,防止max()报错
while($i<strlen($str)){ //$model的第一个字符和$str从第一个字符挨个比对
if($str[$i]!=$model[$j]){ //如果 不相等j依旧等于0,一直停留在当前位置 i++ 直至相等或者跳出循环
//如果不相等则$model 跳回第一个字符 j = 0 ,$str跳回 i+1-$num ,$num=0,继续比对
$j=0;
$i+=1-$num;
$num = 0;
}else{ //如果相等,(1)$num++,两个字符串都移向下一位i++ j++,$num 存入数组 如果相等继续(1)
$j++;
$i++;
$num++;
$res[]=$num;
}
if ($num==strlen($model)){ //如果$model已经100%相似了,则跳出循环
break;
}
}
return max($res); //返回$model在$str顺序最大相似度
}
$str1 = "sdfsgdkg"; //实例
$str2 = "sgd";
echo strmatch($str1,$str2);
输出:
菜鸟一只,为记录学习过程,也为与各位交流,欢迎大神们指正交流