【iOS】——基于Vision Kit框架实现图片文字识别


前言

根据苹果的官方文档,Vision可以执行面部检测、文本检测、条形码识别、图像注册和一般功能跟踪。Vision还允许将自定义Core ML模型用于分类或对象检测等任务。下面只是对文本识别的一个学习。


一、文本识别的分类

Vision的文本识别分为两种方式。

第一种是快速路径(fast),它使用框架的字符检测功能来查找单个字符,然后使用小型机器学习模型来识别单个字符和单词,这种方法类似于传统的光学字符识别(OCR)。

第二种是准确路径(accurate),它使用神经网络查找字符串和行的文本,然后执行进一步分析以查找单个单词和句子。这种方法更符合人类阅读文本的方式。

这两种识别方式都在VNRecognizeTextRequest 类的 recognitionLevel 属性中,并且该属性为枚举类型:

VNRequestTextRecognitionLevelAccurate: 表示精确级别的文本识别。在这个级别下,识别结果的准确性较高,但可能会增加处理时间和资源消耗。
VNRequestTextRecognitionLevelFast: 表示快速级别的文本识别。在这个级别下,识别速度较快,但可能会牺牲一些准确性。

使用其中任意一个路径都可以选择应用基于自然语言处理(NLP)的语言校正阶段,以尽量减少误读的可能性。

流程图如下:

在这里插入图片描述

识别图像中的文本官方文档

二、实现步骤

实现文字识别总共分为六个步骤:

  • 第一步:导入Vision Kit框架
  • 第二步:创建请求处理器
  • 第三步:在请求处理器中设置文字识别功能
  • 第四步:将图片添加到请求处理器中
  • 第五步:发起文字识别请求
  • 第六步:处理识别结果

1.导入Vision Kit框架

1.打开需要导入的Xcode项目

2.在导航器面板中,选择您的项目文件

3.在项目设置中点击"General"选项卡,然后在"Frameworks, Libraries, and Embedded Content"(框架、库和嵌入内容)部分,点击"+"按钮。

在这里插入图片描述

4.在弹出窗口中,搜索并选择"Vision.framework"。

在这里插入图片描述

5.在项目文件中引入头文件

#import <
iOS实现图片识别文字功能可以使用苹果提供的Vision框架,以下是基本的实现步骤: 1. 导入Vision框架:在Xcode中,选中项目,选择General -> Linked Frameworks and Libraries,点击+号,搜索Vision并添加。 2. 创建一个VNImageRequestHandler:这个类用于处理图像请求。可以通过UIImage对象或者CMSampleBufferRef对象创建VNImageRequestHandler。 3. 创建一个VNRecognizeTextRequest:这个类用于识别图像中的文字。 4. 将VNRecognizeTextRequest对象添加到VNImageRequestHandler中。 5. 执行VNImageRequestHandler的perform方法开始识别。 6. 处理识别结果:VNRecognizeTextRequest的结果是一个VNRecognizedTextObservation对象数组,每个对象包含了识别出来的一个文本区域。 以下是示例代码: ```swift import Vision func recognizeText(image: UIImage) { guard let cgImage = image.cgImage else { return } let requestHandler = VNImageRequestHandler(cgImage: cgImage, options: [:]) let request = VNRecognizeTextRequest(completionHandler: handleTextRecognition) do { try requestHandler.perform([request]) } catch { print(error.localizedDescription) } } func handleTextRecognition(request: VNRequest, error: Error?) { guard let observations = request.results as? [VNRecognizedTextObservation] else { return } for observation in observations { guard let topCandidate = observation.topCandidates(1).first else { continue } print(topCandidate.string) } } ``` 在这个例子中,我们先将UIImage对象转化为CGImage对象,然后创建了一个VNImageRequestHandler和一个VNRecognizeTextRequest对象。最后执行VNImageRequestHandler的perform方法,开始识别。当识别完成后,会调用handleTextRecognition方法处理结果。在这个例子中,我们只是简单地将识别出来的文本打印出来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值