对于自动识别验证码,使用trsseract是个不错的选择,有兴趣的的朋友可以试试。
编译tesseract
官网提供了vs2008的编译说明和工程,但在vs2010下的编译时基本相同的,因此我使用的方法就是把vs2008工程转换为vs2010工程,
同时把编译过程中遇到的问题以及解决方法和大家分享一下,希望对正准备使用trsseract库的朋友有所帮助。下载代码
google code 下载一下源代码,并建立build目录。- tesseract-ocr-3.02.02.tar.gz tesseract源代码
- tesseract-ocr-3.02-vs2008.zip vs2008工程文件
- leptonica-1.68-win32-lib-include-dirs.zip tesseract依赖的leptonica的lib和dll文件
创建tesseract-build文件夹,把下载的三个文件解压,得到以下目录结构:

本文介绍了如何在Visual Studio 2010中编译和使用tesseract_ocr来识别验证码。首先,通过将vs2008工程转换为vs2010,然后解决编译过程中遇到的问题,如错误提示和依赖库的配置。编译完成后,使用示例在京东商城的验证码上进行测试,并展示了如何进行二次开发,包括复制头文件和创建新的test工程。
最低0.47元/天 解锁文章
553





