OCR(光学字符识别)是一种众所周知的技术,可以从图像和扫描的文档中识别和读取文本。在OCR操作中,图像上的字符被扫描,识别并转换为数字形式。可以验证转换后的文本并保存以执行进一步的操作。
在本文中,我将向您展示如何在.NET应用程序中使用C#以编程方式对图像执行OCR。本文的其余部分分为以下几节。
- 使用C#对图像执行OCR
- 对具有单行文本的图像执行OCR
目前,.NET版Aspose.OCR升级到v20.4版,使用CPU / GPU改善了性能,调整了新的文本搜索方法,感兴趣的朋友可点击下载。
使用C#对图像执行OCR
让我们看看如何在可能是扫描文档页面的图像上执行OCR。以下是执行此操作的步骤。
- 创建一个AsposeOcr类的实例。
- 通过传递图像的路径并将结果获取到字符串对象中,以调用AsposeOcr.RecognizeImage(string)方法。
下面的代码示例演示如何使用C#对图像执行OCR。
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_OCR(); // Initialize an instance of AsposeOcr AsposeOcr api = new AsposeOcr(); // Recognize image string result = api.RecognizeImage(dataDir + "Sampleocr.bmp"); // Display the recognized text Console.WriteLine(result);
用单行文字在图像上执行OCR
在前面的示例中,我们对包含多行文本的图像执行了OCR。但是,图像可能仅包含一行文本。在这种情况下,您可以告诉API仅识别该行