前言:又到春招季!作为国民级出行服务平台,高德业务快速发展,大量校招/社招名额开放,欢迎大家投递简历,详情见文末。为帮助大家更了解高德技术,我们策划了#春招专栏#的系列文章,组织各业务团队的高年级同学以业务科普+技术应用实践为主要内容为大家做相关介绍。
本文是#春招专栏#系列的第 3 篇,根据 高德视觉技术中心基础研发部 负责人郝志会在AT技术讲坛分享的《视觉技术在POI名称自动化生成的实践》内容整理而成,在不影响原意的情况下略作删节。
春招系列回顾
AT技术讲坛(Amap Technology Tribune)是高德发起的一档技术交流活动,每期围绕一个主题,我们会邀请阿里集团内外的专家以演讲、QA、开放讨论的方式,与大家做技术交流。
郝志会所在团队涉及到计算机视觉方面很多技术:包括目标的检测、识别、分割,几何重建、视觉定位,等等。
高德POI数据的采集
高德有7000万以上的POI(Point of Interest,兴趣点)数据。每年还会出现很多新增的POI,也会有一部分POI停止营业、关门倒闭。这些POI如何制作和更新?从采集方式来看会有很多获取POI的方式,有一种重要而且直观的采集方式,高德通过众包方式采集街边店铺的图像,利用计算机视觉技术(以及人工辅助)从图像中提取POI数据。
下图演示了一次众包化采集过程。高德的采集人员从这条街走过,拍摄连续图像。最后把图像和GPS坐标,上传给高德。
下图是一个POI从采集到生产,再到使用的示意图。输入的是连续采集的图像,对于生产环节,最重要的是计算每个POI的内容和位置。然后和母库中的POI匹配,确认这个POI是已经存在的,还是需要新增。从图像中识别POI的名称,计算坐标,都需要用到计算机视觉技术。
本文主要介绍的是名称的部分。实际上,高德的POI生产不是全自动化的,而是人机结合的方式。当机器不能自动化,或者置信度较低时,交给人工作业。
高德的POI数据采集—生产—使用流程示意图
POI数据丰富多彩的呈现形式,给自动化的处理过程带来了挑战,包括:文字的识别、是否为POI、文字之间关系、如何命名(定名)…