3、地理信息系统自动标签扩展与应用开发技术

地理信息系统自动标签扩展与应用开发技术

自动标签扩展方法

在地理信息系统中,兴趣点(POI)的标签扩展是一项重要任务。通过对主要店铺标签的 k - 元组分析,发现程序提取的 k - 元组与手动选择的相近。例如,对于超市,k - 元组几乎都是超市连锁店的名称,加油站连锁店也有类似结果。而且,几乎所有类别中都能找到在各自类别名称中出现超过 10% 的 k - 元组,这表明很多名称包含分类信息,可用于标签扩展。

在旅游和休闲标签方面,识别出 168 种不同的旅游标签,其中 16 种出现超过 200 次,“information”“hotel”“attraction”的出现次数最多。休闲标签有 153 种,高频的有 9 种。由于“artwork”难以有一致的指示词,“attraction”类别过于多样且提取的 k - 元组太笼统,将它们排除后,把剩余 23 个类别输入分类器。最初的交叉验证发现“information”和“hotel”混淆严重,为此先创建酒店分类器来修剪“information”数据,整体准确率从 62% 提高到 73%。

对于实际数据,新增了 3452 个带有旅游或休闲标签的 POI。在计算精度时,因“information”标签的实体常是徒步小径旁的标志,且多数类别未被分配标签,所以仅对“hotel”“playground”“marina”和“sports centre”进行精度计算,检查每个类别 50 个示例,整体准确率达 92%,“sports centre”甚至达到 98%。
| 标签类别 | 出现次数 |
| — | — |
| information | 45,879 |
| hotel | 12,228 |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值