服务简介
通用 OCR 技术提供图片整体文字的检测和识别服务,返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别,以及中英文、字母、数字的识别。
应用场景:印刷文档识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、互联网头像文字识别等。
计费方式
腾讯云文字识别(OCR)按照实际使用量付费,采用后付费方式,次月 1~3 日会出本月账单,进行账号扣费。
OCR 识别
图片 OCR 识别按照月接口调用采取阶梯到达计费方式,当月总量在哪个阶梯内,则按该阶梯单价计费,接口调用量越大,单价越低。
月接口调用总量 | 0<调用量≤1000 | 1000<调用量≤1 万 | 1万<调用量≤10万 | 10 万以上 |
---|---|---|---|---|
身份证识别 | 免费 | 0.2 元/次 | 0.12 元/次 | 0.08 元/次 |
名片识别 | 免费 | 0.05 元/次 | 0.04 元/次 | 0.02 元/次 |
行驶证/驾驶证 | 免费 | 0.2 元/次 | 0.15 元/次 | 0.08 元/次 |
银行卡 | 免费 | 0.2 元/次 | 0.15 元/次 | 0.08 元/次 |
营业执照 | 免费 | 0.2 元/次 | 0.15 元/次 | 0.08 元/次 |
车牌 | 免费 | 0.2 元/次 | 0.15 元/次 | 0.08 元/次 |
通用印刷体识别 | 免费 | 0.2 元/次 | 0.15 元/次 | 0.08 元/次 |
通用手写体识别 | 免费 | 0.2 元/次 | 0.15 元/次 | 0.08 元/次 |
1、GitHub下载腾讯云提供的SDK
SDK获取
智能图像的 Java SDK 下载地址:Java-SDK-V2.0。
使用前准备
- 前往注册: 腾讯云账号注册 (详细指引见 注册腾讯云)
- 取得存储桶名称 BucketName: 请前往 创建存储桶 ;
- 取得 APPID、SecretId、SecretKey:请前往 云API密钥 ,单击“新建密钥”。
如何集成到您的项目中
获得 SDK jar 文件
- 直接使用
release/*-with-dependencies.jar
- 或者自行编译:在工程根目录下执行命令
mvn assembly:assembly
,编译结果见 target/*-with-dependencies.jar
导入 jar 到项目中
根据项目具体情况导入 *-with-dependencies.jar
初始化
ImageClient imageClient = new ImageClient(APPID, SecretId, SecretKey);
设置代理
根据实际网络环境,可能要设置代理,例如:
Proxy proxy = new Proxy(Type.HTTP, new InetSocketAddress("127.0.0.1", 8080));
imageClient.setProxy(proxy);
使用
SDK 提供功能如下:
图像识别:鉴黄,标签
文字识别(OCR):身份证,名片,通用,驾驶证行驶证,营业执照,银行卡,车牌号
人脸识别:人脸检测,五官定位,个体信息管理,人脸验证,人脸对比及人脸检索
人脸核身:照片核身(通过照片和身份证信息),获取唇语验证码(用于活体核身),活体核身(通过视频和照片),活体核身(通过视频和身份证信息)
更多例子详情可参见 Demo.java 的代码。
如何运行这个 Demo 工程
-
修改文件 src/main/java/com/qcloud/image/demo/Demo.java 的 main() 方法,填入上述申请到的 APPID、SecretId、SecretKey、BucketName
-
导入到 IDE:这个 Demo 工程是用 Maven 构建的,以 Intellij IDEA 为例,导入方式为:Import Project -> 选择工程目录 ->
Import project from external model -> Maven - 运行:Demo.java 右键,Run Demo.main()
(以上内容均来自腾讯云API文档)
一、前期准备工作完成之后我们来完成我们这个小项目。
第一步新建一个web项目(IDEA),结构如下(导入相关jar包):
项目建好,jar包导入完成之后我们把一些文件夹建立一下:
好了,接下来我们开始写代码,我们先写一个测试demo
测试能够进行识别之后我们找一个页面模板(前端渣),一个上传按钮,一个文本框就可以了。
页面搞定之后我们把后台逻辑代码写一下。
后台逻辑代码写完之后我们需要打通前后台的联系,前端用的是Ajax,上传图片用的Struts2。
部分JS代码。
web.xml文件配置
Struts2文件配置
日志配置就不说了。
接下来就是把项目跑起来调试和完善细节了。
以下就是我测试的一些截图。
需要识别的图片
识别出来的内容
识别图片
识别结果
附我的代码下载地址:https://download.youkuaiyun.com/download/qq_24373533/10540422