高德POI数据生产中的计算机视觉技术

原创

于 2021-03-22 17:33:47 发布 · 1.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #大数据 #数据挖掘 #编程语言 #python

本文介绍了高德如何利用计算机视觉技术从图像中提取POI数据，特别是通过自然场景文字识别、文本属性判定和结构化处理生成POI名称。高德的POI数据采集依赖于众包图像，通过深度学习和传统算法相结合的方法处理复杂场景的文字识别。文章还探讨了在处理过程中面临的挑战，如字体多样性、排版复杂性，并展示了高德在STR技术上的进展和解决方案。

前言：又到春招季！作为国民级出行服务平台，高德业务快速发展，大量校招/社招名额开放，欢迎大家投递简历，详情见文末。为帮助大家更了解高德技术，我们策划了#春招专栏#的系列文章，组织各业务团队的高年级同学以业务科普+技术应用实践为主要内容为大家做相关介绍。

本文是#春招专栏#系列的第 3 篇，根据 高德视觉技术中心基础研发部 负责人郝志会在AT技术讲坛分享的《视觉技术在POI名称自动化生成的实践》内容整理而成，在不影响原意的情况下略作删节。

春招系列回顾

面向自动驾驶的高精地图及数据采集生产体系

AI在出行场景的应用实践：路线规划、ETA…

阿里高德算法面试经验宝典（完整流程）

AT技术讲坛(Amap Technology Tribune)是高德发起的一档技术交流活动，每期围绕一个主题，我们会邀请阿里集团内外的专家以演讲、QA、开放讨论的方式，与大家做技术交流。

郝志会所在团队涉及到计算机视觉方面很多技术：包括目标的检测、识别、分割，几何重建、视觉定位，等等。

高德POI数据的采集

高德有7000万以上的POI（Point of Interest，兴趣点）数据。每年还会出现很多新增的POI，也会有一部分POI停止营业、关门倒闭。这些POI如何制作和更新？从采集方式来看会有很多获取POI的方式，有一种重要而且直观的采集方式，高德通过众包方式采集街边店铺的图像，利用计算机视觉技术（以及人工辅助）从图像中提取POI数据。

下图演示了一次众包化采集过程。高德的采集人员从这条街走过，拍摄连续图像。最后把图像和GPS坐标，上传给高德。