AI技术已经家喻户晓。不论是移动终端设备,还是企业系统平台,都开始集成AI能力,现阶段看,AI融合到各个行业的潜力非常巨大,能够在众多场景中发挥作用,比如云计算。在今天数字化转型的浪潮中,企业上云成为了新常态,云上大量的数据、丰富的应用通过AI技术,能够解决很多问题,因此云与AI的融合也是新常态。
因为腾讯强大的社交、游戏等基因,腾讯AI有着非常丰富的实践场景,在朋友圈爆款应用、OCR识别、医疗、游戏等场景中都运用了AI技术,开发出了大量的新功能和能力。即便如此,AI在这些领域的尝试有些还在初级阶段。如何在具体业务场景中提供匹配的能力,利用AI把问题简单化,释放生产力,依然非常具有挑战性。
7月28日,腾讯云在北京举办云+社区沙龙,邀请来自腾讯与四川云检科技的五位AI技术专家,分享他们在专业领域的AI开发经验,帮助开发者在具体行业场景中实践AI技术。包括在具体落地场景中可能遇到的各种难题,涉及具体开发中的方方面面,帮助开发者在具体的行业场景中实践AI技术,开发出优质应用。现场有近400位开发者参与,多位开发者与讲师就演讲内容展开讨论,表现出对AI浓厚的开发兴趣。
朋友圈爆款背后的计算机视觉技术与应用
在现阶段,强调AI在场景中落地,就是希望AI走进千家万户,融入整个社会,而不仅仅是曲高和寡的模型,这就是AI技术产业化的趋势。比如,朋友圈里像军装照、武士青年这种有趣的互动活动,就是目前探索出来的计算机视觉最快能够来到大家身边的落地应用。对于开发者来说,通过对具体案例流程的了解,就能够快速的掌握开发所需要的能力,从而实现自主创新开发。
腾讯大数据与人工智能中心AI技术专家叶聪在沙龙活动中就以朋友圈一些爆款活动作为切入点,帮助开发者们梳理了当前关于计算机视觉与技术的应用。叶聪表示,腾讯云现在非常讲究AI场景化,在很多的应用中都集成了AI能力。
五四青年节的活动《重温五四,你最像哪位青年?》就是腾讯首先开始做的。通过人脸检测与分析技术、人脸检索技术,将用户上传的照片与特定形象进行脸部层面的检索对比,通过匹配分析找出数据库中外貌特征与用户最为相似的一张照片,这个创意为后续AI娱乐产品设计提供了参考。
相比于学术角度对计算机视觉的定义——如何让计算机从图像和视频中获取高级、抽象的信息,从工程角度来看,「使机器模仿人类的视觉能力变的自动化」的定义则更明了。叶聪介绍,计算机视觉使机器可以部分代替人力理解图片中的信息。计算机视觉还包含一些分支,主要包括物体识别、对象检测、语义分割、运动和跟踪、三维重建、视觉问答、动作识别等等,同时新的分支还在不断出现。
现在比较热门的视觉应用包括人脸识别、无人驾驶、语义分割等。语义分割在AI领域比较常见,一般指词性的分割,或者词的分割。而图像分割里面的语义分割一般指的是把图像里面的不同类型的对象进行标注和区分。
在机器识别领域,现在已经有很多比较成熟的特征提取方法。比如边缘检测方法,图片对象的局部对称性,尺度不变特征,利用灰度的原理等等,这些算法都能够实现提取,但不存在最优方案。在图像分割和对象检测领域也有一些其他算法,例如分水岭算法,分水岭顾名思义就是利用图像的灰度特性把这个图像整个灰度的曲线显示出来。另外,对象检测的常用算法叫主观形状模型,比如以人脸为标准,人脸上有68个点,对这些点进行变换,再去实现匹配目标。
图像识别领域的发展经历了CNN,R-CNN,Faster R-CNN等几个阶段。现在图像识别的流行趋势会趋于大自然的发展逻辑,是一个大循环。那么,基于这些科学实验基础,腾讯云是如何支持AI应用的呢?以五四青年活动为例,它是解决图像匹配的一个活动。首先,从训练数据开始,一般是民国时候的老照片,对它进行提取和标注数据,因为每个照片都有标注,就会生成模型。当用