作者:Geo地址匠(转载请注明出处)
在处理人员登记信息或者收货地址管理时,常常需要把地址里的省市区镇拆分出来方便后续分类管理。
例如对于地址“上海市静安区乌鲁木齐中路12号”,单独拆分出“上海市/静安区”。
目前一些基于规则的方法无法覆盖到所有情况,比如:
- 通过“xx省”“xx市”后缀来找省市区的,当缺少该后缀便无法工作。例如:上海静安华山医院,按照后缀是找不到上海和静安的。
- 通过字符长度来切割的,例如设置省的长度为3,当遇到长度不同的省市区名称变会出错。例如:内蒙古自治区,按照长度切割,内蒙古会被识别为省,自治区会被识别为市。
我们开源了一个地址AI预训练底座以及一系列下游应用模型MGeo(ModelScope 魔搭社区),可以用来识别地址里面的省市区。
首先需要安装python3.7的环境,没有anaconda的可以直接下载安装python3.7:
conda create -n py37testmaas python=3.7
conda activate py37testmaas
安装相关依赖:

在处理地址信息时,文章介绍了如何利用Python和MGeo AI模型精确拆分Excel中的省市区街道。MGeo能识别不同格式的地址,避免了基于规则拆分的局限性,如缺少特定后缀或长度不一致的问题。文章提供了安装和使用步骤,展示如何读取Excel,识别地址,并保存结果。
最低0.47元/天 解锁文章
1500





