高德POI数据生产中的计算机视觉技术

本文介绍了高德如何利用计算机视觉技术从图像中提取POI数据,特别是通过自然场景文字识别、文本属性判定和结构化处理生成POI名称。高德的POI数据采集依赖于众包图像,通过深度学习和传统算法相结合的方法处理复杂场景的文字识别。文章还探讨了在处理过程中面临的挑战,如字体多样性、排版复杂性,并展示了高德在STR技术上的进展和解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言:又到春招季!作为国民级出行服务平台,高德业务快速发展,大量校招/社招名额开放,欢迎大家投递简历,详情见文末。为帮助大家更了解高德技术,我们策划了#春招专栏#的系列文章,组织各业务团队的高年级同学以业务科普+技术应用实践为主要内容为大家做相关介绍。

本文是#春招专栏#系列的第 3 篇,根据 高德视觉技术中心基础研发部 负责人郝志会在AT技术讲坛分享的《视觉技术在POI名称自动化生成的实践》内容整理而成,在不影响原意的情况下略作删节。

春招系列回顾

面向自动驾驶的高精地图及数据采集生产体系

AI在出行场景的应用实践:路线规划、ETA…

阿里高德算法面试经验宝典(完整流程)

AT技术讲坛(Amap Technology Tribune)是高德发起的一档技术交流活动,每期围绕一个主题,我们会邀请阿里集团内外的专家以演讲、QA、开放讨论的方式,与大家做技术交流。

 

郝志会所在团队涉及到计算机视觉方面很多技术:包括目标的检测、识别、分割,几何重建、视觉定位,等等。

 

高德POI数据的采集

高德有7000万以上的POI(Point of Interest,兴趣点)数据。每年还会出现很多新增的POI,也会有一部分POI停止营业、关门倒闭。这些POI如何制作和更新?从采集方式来看会有很多获取POI的方式,有一种重要而且直观的采集方式,高德通过众包方式采集街边店铺的图像,利用计算机视觉技术(以及人工辅助)从图像中提取POI数据。

下图演示了一次众包化采集过程。高德的采集人员从这条街走过,拍摄连续图像。最后把图像和GPS坐标,上传给高德。

 

下图是一个POI从采集到生产,再到使用的示意图。输入的是连续采集的图像,对于生产环节,最重要的是计算每个POI的内容和位置。然后和母库中的POI匹配,确认这个POI是已经存在的,还是需要新增。从图像中识别POI的名称,计算坐标,都需要用到计算机视觉技术。

本文主要介绍的是名称的部分。实际上,高德的POI生产不是全自动化的,而是人机结合的方式。当机器不能自动化,或者置信度较低时,交给人工作业。

 

高德的POI数据采集—生产—使用流程示意图

 

POI数据丰富多彩的呈现形式,给自动化的处理过程带来了挑战,包括:文字的识别、是否为POI、文字之间关系、如何命名(定名)…

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值