React配合 tesseract.js 实现纯前端文字识别,英文识别会丢字,中文识别结果很迷。
安装
目前使用版本为4.1.1。
npm install tesseract.js
引用
import {createWorker} from 'tesseract.js';
使用
- chi_sim:中文、eng:英文。
const worker = await createWorker();
await worker.loadLanguage('chi_sim');
await worker.initialize('chi_sim');
const { data: { text } } = await worker.recognize(myImage);
console.log(text);
await worker.terminate();
结果
demo1
识别结果:
demo2