给定一篇文本(新闻),确定其归属地(地名)的python工具

介绍一款能够自动从文本中抽取地名的工具,适用于新闻等文本,能准确识别国内外地名,国内精确到省市级别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

⭐戳这里在线使用 => 地址抽取

有时候需要确定一篇新闻文本的地名,比如

上海市实施了垃圾分类...

其地名,即归属地是上海,本工具就是实现这个功能的。

给定一篇文章,可包含标题和正文(或仅标题,仅正文),确定其归属地(地名)。

  • 结果标准:
    • 区分国内国外,
    • 国外到国家名一级
    • 国内到省市一级

安装

  • 使用 python3
$ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .

使用方法

样例1

import loc_reg
title = '湖南2018年度企业环境信用评价公示 39家企业拟被评“不良”'
passage = '今天,记者从湖南省生态环境厅获悉,我省2018年度企业环境信用评价拟定结果正在长沙市进行公示,拟评定环境诚信企业31家、环境合格企业1247家、环境风险企业121家、环境不良企业39家。'
print(loc_reg.predict(title, passage))

结果为:

{'国内': [{'省': '湖南', '市': '长沙'}]}

样例2

passage = '近日,布鲁塞尔爆发了大规模罢工游行,城市服务、商店、餐饮店均受到影响,原因和欧盟税收等政策有关。'
print(loc_reg.predict(passage))

结果为:

{'国外': ['比利时']}

说明

  • 从舆情新闻数据中随机抽取 100 篇自测,正确率 93%。其他类型文本未测试,效果待定。

如果觉得好用,请 follow 我一下 https://github.com/dongrixinyu

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值