Mac安装Tesseract-OCR
安装: brew install tesseract
语言库
下载地址:https://github.com/tesseract-ocr/tessdata
简体中文库:chi_sim.traineddata
下载简体中文库chi_sim.traineddata
,然后将文件拷贝到到:/usr/local/Cellar/tesseract/3.04.01_2/share/tessdata
目录下即可。
库名对应的文件简称
库名 | 语言 |
---|---|
afr | Afrikaans(南非荷兰语) |
amh | Amharic(阿姆哈拉语) |
ara | Arabic(阿拉伯语) |
asm | Assamese(阿萨姆) |
aze | Azerbaijani(阿塞拜疆) |
aze_cyrl | Azerbaijani - Cyrilic(阿塞拜疆-Cyrilic) |
bel | Belarusian(白俄罗斯) |
ben | Bengali(孟加拉) |
bod | Tibetan(西藏) |
bos | Bosnian(波斯尼亚) |
bul | Bulgarian(保加利亚语) |
cat | Catalan; Valencian(加泰罗尼亚语; 巴伦西亚) |
ceb | Cebuano(宿务) |
ces | Czech(捷克) |
chi_sim | Chinese - Simplified(中国-简体) |
chi_tra | Chinese - Traditional(中国-繁体) |