python3 图像识别安装pytesseract和PIL遇到的坑

首先说明,这是本人安装到使用过程中遇到的情况,有不懂的可以交流,不要喷人。

注意版本,我用的是3.8,注意版本,我用的是3.8,注意版本,我用的是3.8,注意版本,我用的是3.8,注意版本,我用的是3.8,重要的事情多说几遍,以免版本对不上,应该python3的都适用。

第一步:安装python3 PIL
PIL 在python3中安装会提示失败的,需要安装pillow库,这个模块比较奇葩,安装pillow模块,编译器导包却是导PIL模块

安装命令:pip install pillow 或者其他方法,不一定要这样安装,能安装成功就好

再次强调:安装成功了pillow模块,在编译器模块导入模块的时候是导PIL,这就是我说这个模块奇葩的地方,对新人特别不友好,安装pillow模块,编译器导包却是导PIL模块,下面图片展示。
python3 图像识别安装pytesseract和PIL遇到的坑

第二步:

安装pytesseract模块,安装Tesseract-OCR软件,下载Tesseract-OCR语言包
这是三个东西,要区分

1.安装pytesseract模块
pip install pillow 或者其他方法,不一定要这样安装,能安装成功就好

2.安装Tesseract-OCR软件

这是另外一个博主的教程,地址附上:
https://blog.csdn.net/weixin_48632536/article/details/107752772
当然,为了节省时间,我把需要的部分拷过来了

我安装的是Tesseract-OCR V4.1.0版本安装,有两个,一个是32位,一个64位,不懂就那个不行就换另一个
下载地址:https://digi.bib.uni-mannheim.de/tesseract
Tesseract-OCR软件环境搭建下图所示:
用户变量和系统变量都要添加Tesseract-OCR软件的安装路径,如我的Tesseract-OCR软件安装路径是
python3 图像识别安装pytesseract和PIL遇到的坑

python3 图像识别安装pytesseract和PIL遇到的坑
然后还要更改pytesseract模块下的代码
我的路径是这里,具体看自己python模块的存放路径

python3 图像识别安装pytesseract和PIL遇到的坑

python3 图像识别安装pytesseract和PIL遇到的坑

pytesseract模块下的代码tesseract_cmd =xxx 要改为Tesseract-OCR软件安装路径
tesseract_cmd = r’C:\Program Files (x86)\Tesseract-OCR\tesseract.exe’,也就是和图片一样

python3 图像识别安装pytesseract和PIL遇到的坑

3.下载Tesseract-OCR语言包

这是借用其他博主的链接,所以博主地址附上:
https://blog.csdn.net/qq_38161040/article/details/90727456
当然,为了节省时间,我把需要部分拷过来了

下载地址:https://pan.baidu.com/s/1uuSTBNo3byJib4f8eRSIFw 密码8v8u
如果失效,自行百度下载

下载完,直接放到安装位置的tessdata文件夹里就好了。
python3 图像识别安装pytesseract和PIL遇到的坑注意语言文件是chi-sim什么的,要对应图片的,是简体中文,其他语言有时间自己玩玩
最后,代码执行,可以参考下面这张图
python3 图像识别安装pytesseract和PIL遇到的坑

额,识别效果就。。。还需要配合其他模块使用,这里就不多讲了