步骤1:成为开发者
请您使用阿里云账号登录阿里云视觉智能开放平台。如还未持有阿里云账户,请先注册阿里云账号。
步骤2:能力调试
单击首页上方导航栏能力广场,选择文字识别类目中的身份证识别,进入该能力的体验中心,开始调试。
- 单击上传图片上传待识别的身份证照片。
- 根据照片属性选择身份证正反面类型,单击发起调用。
- 在下方查看调用结果。
- 左侧区域:展示当前接口调用结果的代码示例。
- 右侧区域:展示您上传的图片,您也可以单击切换文档来查看该接口的介绍文档。
说明 示例图片中的数据为测试数据,非真实数据。
步骤3:能力开通
说明
- 开通一个类目的AI能力即可调用该类目包含的所有AI能力;开通能力不产生费用。
- 公测期能力免费使用。
- 付费能力的计费和购买方式,详情请参见计费说明总览。
开通成功后,可以选择进入控制台,也可以进入类目介绍页面,查看类目文档。
步骤4:创建AccessKey
在使用阿里云SDK和调用视觉智能开放平台的API之前,确保您已经生成访问密钥(AccessKey)。您可以在个人中心AcessKey管理中创建并管理属于您自己的AccessKey,详情请参见创建AccessKey。
步骤5:启动开发
- 下载安装SDK包。目前,SDK支持Java、Python、Node.js、PHP、C#五种常用语言,您可以选择对应语言类目下的视觉技术能力SDK进行接入。
- RAM授权。
您还需要为您的账户进行RAM授权,以访问相应的阿里云资源。授权操作详情请参见使用RAM Policy控制访问权限。
- 开始本地调用。
参考身份证识别接口文档,进行开发。
目前阿里云视觉智能平台上已有13大类、150+项AI能力,您可以选择各类能力的文档,查看详细参数及具体使用方法。
能力介绍
目前阿里云视觉智能开放平台上线的图像识别能力包括:
类别 | 能力 | 说明 |
---|---|---|
图像打标 | 通用图像打标 | 识别图像中的主体内容并打上类型标签,支持数千个内容标签,覆盖常见物体品类。 |
基础识别 | 颜色识别 | 对输入图的颜色信息进行分析,给出颜色值(RGB形式和HEX格式)与对应的占比信息。 |
元素识别 | 识别输入图中所包含的元素,用矩形框标注出其位置,并区分其对应的基本类型(人/物、修饰、文案)。 | |
Logo识别 | 识别输入图片中的logo信息。 | |
风格识别 | 对输入图的风格类型进行分析,给出可能的风格标签。例如:
| |
垃圾分类识别 | 对图片中的垃圾进行分类,并给出具体的物品名称。 | |
水果检测识别 | 识别60种常见的水果和16种坚果。 | |
车型识别 | 识别汽车图片(完整或部件图片)的类型,目前主要有小轿车、多用途汽车、SUV等类别。 | |
证件照质量审核 | 可以识别拍摄的证件照片是否存在质量问题,且有哪些质量问题。 | |
菜品识别 | 可以识别出图片中的菜品类别名称和热量。 | |
场景识别 | 场景识别 | 识别图像所处的场景环境,支持数十种常见场景,如天空、草地等。 |
应用场景
图像识别应用场景如下:
- 智能相册编辑与管理
可以根据职能标签将相册图片进行分类,例如将风景照细分为天空、沙滩、夕阳等子类别,也可以将人物事件分为聚餐、运动、演出等类别。
- 视频场景分析
基于大量图像识别数据,用深度学习算法训练,可准确识别视频中的物体和内容,实现对视频全自动且准确的快速识别,提高检索效率精度和播放量,节省人力成本,并实现自动化的视频内容检索服务、个性化推荐、内容检索服务、审查和分发。
阿里云高校计划,陪伴两千多所高校在校生云上实践、云上成长。在这里你可以领用免费的cpu资源,还可以参加免费训练营,实践提高:https://developer.aliyun.com/adc/student/