3月27日,阿里云发布了智能视觉服务,发布会的副标题叫做:为零算法基础的开发者和企业提供定制化模型训练能力。
阿里云在此之前也有和机器视觉有关的产品,包括:
- 人脸识别、提供人脸的监测定位、属性识别、匹配对比、人脸检索等服务。
- 图像搜索、实现图片的快速检索,就是我们在手机淘宝上用的“拍立淘”功能。
- 图像识别、自动给图像打标签,支持图片和视频场景。
- 内容安全、包括鉴黄、涉暴涉恐、Logo商标、垃圾广告、不良场景、风险人物、视频风险内容的识别。
- 文字识别、包括图片和视频中的文字识别、行业票据场景的文字识别。
- 多模态识别、综合应用图像标签、人脸识别、文字识别、场景识别,对视频进行数字化打标。
这些服务的模型都是事先训练好的,假如觉得现有的模型不能很好的匹配您的业务场景,想拥有自己的定制化模型,一般情况下就只能租用ECS服务器或者机器学习PAI用TensorFlow自己训练。我们知道训练模型是一个费钱的工作,因为需要大量的标注好的数据才能让模型有不错的效果,还要投入大把的金钱购买计算资源及雇佣专业人员,团队中得有几个博士头衔的才能搞得定各种算法和模型的优化。
新发布的“智能视觉”可以让零算法基础的开发人员也能进行定制化模型的训练。
训练的过程就是在指定标签下上传和标注图片,上传的量也不需要很大,最少十几张就可以满足基本的训练要求。标注完成后可以一键生成业务专属的迭代模型,迭代模型不仅支持图片识别还支持对视频进行识别,通过API接口该模型即可上线提供识别服务。
什么叫作标注?就是在智能视觉学习平台中选中需要识别的主体。
为啥这么简单,就是因为这个产品的背后应用了迁移学习,就是利用现有模型再通过少量数据和训练来实现更快速、更低成本的模型定制。
为了让少量的标注数据产生更大的价值,智能视觉还应用了数据增广,就是对原始图像进行各种旋转变换后生成更多的训练样本,从而能够让少量的标注数据就可以产生很好的泛化效果。
阿里云智能视觉服务把机器视觉的复杂算法和细节隐藏起来,让没有任何算法基础的开发人员也能结合不同的业务场景开发出定制化的人工智能SaaS应用。按照我的理解,智能视觉服务的发布也是阿里云“被集成”战略的一部分。
阿里云自己不做SaaS,让大家来做更好的SaaS。