python/java 不限语言 基于tesseract的图片文字图片验证码识别

第一步下载我用的window
下载合适的exe安装文件:
网址:https://digi.bib.uni-mannheim.de/tesseract/,下载完成后后装即可

第二步环境变量配置
python/java 不限语言 基于tesseract的图片文字图片验证码识别
在Path中添加上图所示路径,改路径位tesseract安装位置。

第三步指令测试
通过指令tesseract + 要试别的图片 + 结果文件名 + -l +语言训练集名
python/java 不限语言 基于tesseract的图片文字图片验证码识别

测试结果如下:
python/java 不限语言 基于tesseract的图片文字图片验证码识别python/java 不限语言 基于tesseract的图片文字图片验证码识别
第一个图片是网站的登录验证码,对于这种图片识别很难准确,需要对图片进行一些特殊处理(降噪,去干扰),可以通过python 中的pillow来进行处理。
第二个图片是干净的文字图片,这种图片一般识别准确率都很高,对图片的处理就是把图片中的文字变干净。

本人用的python3.7的版本
下载指令 pip3 install pillow或者pip install pillow
不需要下载python tesseract依赖库,建议直接使用python提供的脚本工具调用指令来使用tesseract。