React+ tesseract.js实现纯前端文字识别

原创

已于 2023-07-13 09:14:15 修改 · 701 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#前端 #javascript #react.js

于 2023-07-04 11:06:44 首次发布

本文介绍如何在React应用中结合tesseract.js库实现前端的文字识别功能，包括安装、引用和使用方法，但指出该方案在英文识别和中文识别上存在准确性问题。

React配合 tesseract.js 实现纯前端文字识别，英文识别会丢字，中文识别结果很迷。

安装

目前使用版本为4.1.1。

npm install tesseract.js

引用

import {createWorker} from 'tesseract.js';

使用

chi_sim：中文、eng：英文。

      const worker = await createWorker();
      await worker.loadLanguage('chi_sim');
      await worker.initialize('chi_sim');
      const { data: { text } } = await worker.recognize(myImage);
      console.log(text);
      await worker.terminate();