OCR文字识别，基于腾讯云的demo，Ajax+Struts2上传图片进行文字识别

最新推荐文章于 2024-05-11 17:28:42 发布

原创最新推荐文章于 2024-05-11 17:28:42 发布 · 1k 阅读

CC 4.0 BY-SA版权

文章标签：

11 篇文章

订阅专栏

1 篇文章

订阅专栏

1 篇文章

订阅专栏

本文介绍腾讯云OCR技术的使用方法、应用场景、计费方式及实例代码演示，涵盖图片文字识别、身份证识别、名片识别等，适用于印刷文档识别、广告图文字识别等多种场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

通用 OCR 技术提供图片整体文字的检测和识别服务，返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别，以及中英文、字母、数字的识别。
应用场景：印刷文档识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、互联网头像文字识别等。

腾讯云文字识别（OCR）按照实际使用量付费，采用后付费方式，次月 1~3 日会出本月账单，进行账号扣费。

图片 OCR 识别按照月接口调用采取阶梯到达计费方式，当月总量在哪个阶梯内，则按该阶梯单价计费，接口调用量越大，单价越低。

月接口调用总量	0<调用量≤1000	1000<调用量≤1 万	1万<调用量≤10万	10 万以上
身份证识别	免费	0.2 元/次	0.12 元/次	0.08 元/次
名片识别	免费	0.05 元/次	0.04 元/次	0.02 元/次
行驶证/驾驶证	免费	0.2 元/次	0.15 元/次	0.08 元/次
银行卡	免费	0.2 元/次	0.15 元/次	0.08 元/次
营业执照	免费	0.2 元/次	0.15 元/次	0.08 元/次
车牌	免费	0.2 元/次	0.15 元/次	0.08 元/次
通用印刷体识别	免费	0.2 元/次	0.15 元/次	0.08 元/次
通用手写体识别	免费	0.2 元/次	0.15 元/次	0.08 元/次

1、GitHub下载腾讯云提供的SDK

智能图像的 Java SDK 下载地址：Java-SDK-V2.0。

根据项目具体情况导入 *-with-dependencies.jar

ImageClient imageClient = new ImageClient(APPID, SecretId, SecretKey);

根据实际网络环境，可能要设置代理，例如：

Proxy proxy = new Proxy(Type.HTTP, new InetSocketAddress("127.0.0.1", 8080));
imageClient.setProxy(proxy);

SDK 提供功能如下：

图像识别：鉴黄，标签

文字识别(OCR)：身份证，名片，通用，驾驶证行驶证，营业执照，银行卡，车牌号

人脸识别：人脸检测，五官定位，个体信息管理，人脸验证，人脸对比及人脸检索

人脸核身：照片核身（通过照片和身份证信息），获取唇语验证码（用于活体核身），活体核身（通过视频和照片），活体核身（通过视频和身份证信息）

更多例子详情可参见 Demo.java 的代码。

修改文件 src/main/java/com/qcloud/image/demo/Demo.java 的 main() 方法，填入上述申请到的 APPID、SecretId、SecretKey、BucketName
导入到 IDE：这个 Demo 工程是用 Maven 构建的，以 Intellij IDEA 为例，导入方式为：Import Project -> 选择工程目录 ->
Import project from external model -> Maven
运行：Demo.java 右键，Run Demo.main()

（以上内容均来自腾讯云API文档）