Tesseract OCR 识别语言编码 简体中文chi_sim

Tesseract OCR是一款开源的光学字符识别库,支持多种语言,包括简体中文chi_sim。语言编码遵循3字符的ISO 639-2标准。要使用非标准语言包,如foo.traineddata,需设置TESSDATA_PREFIX环境变量,并指定-l foo参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Teseeract ORC 是一款开源的ORC识别库。备注下识别语言编码:简体中文是chi_sim。Tesseract uses 3-character ISO 639-2 language codes。
如下从其gitHub摘抄的:地址:https://github.com/tesseract-ocr/tesseract/blob/a75ab450a8cc9a2b69cf05f5c4f7a39bc44cbacc/doc/tesseract.1.asc

=======================

afr (Afrikaans) amh (Amharic) ara (Arabic) asm (Assamese) aze (Azerbaijani) aze_cyrl (Azerbaijani - Cyrilic) bel(Belarusian) ben (Bengali) bod (Tibetan) bos (Bosnian) bul (Bulgarian) cat (Cat

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值