我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)

人生中第一写博客。。。看起来很复杂的样子。。。
好吧回归一下正题,最近我在学习爬虫,我买了崔庆才写的那本《Python3网络爬虫开发实践》。在第一章1.3解析库的安装那里,按照书上的方法安装tesserocr总是出错,于是我在网上搜了很多的解决办法,但是总不成功。
我装的Python是3.8版本,网上很多方法说要去下载whl文件,但是我没找到对应版本的文件,后来我又搜了很多资料,好多人说Python3.8版本的没有对应的whl文件,而且建议装低版本的python,或者直接就跳过这部分…对于一个好不容易装好软件配置了很多库的小白。。。这简直就是晴天霹雳。。。
我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)报了很多的错误,这是某次失败的时候截的图,红乎乎一大片,咱也不太明白啥意思。。。

本来是打算放弃的,结果试着试着一不小心就成功了。决定写一下自己安装的过程,希望可以带给大家帮助。

这里开始正题,上面都是废话。。。

我的电脑是Win10版本。

  1. 首先下载tesseract
    tesseract下载地址
    2.我安装的是tesseract-ocr-w64-setup-v5.0.0.20190623.exe,勾选Additional script data (download)和Additional language data (download),下载速度很慢。但是这一步报了几个错,好像是有的script data没有装成功。但是应该没有什么太大问题,我就没有管。
    3.配置环境变量,Path:你的安装目录\Tesseract-OCR。配置环境变量,新建变量名TESSDATA_PREFIX,变量值:你的安装目录\Tesseract-OCR\tessdata
    4.cmd命令行tesseract -v可以查看版本我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)
    5.在命令行输入下列命令

    pip install pytesseract
    pip install pillow

神奇的一幕出现了,它居然就成功了,哈哈哈。
我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)
然后验证一下安装就可以。由于我是第一次写文章,这个格式实在搞得我头很大,所以我就把我的截图放上去好了,我是个手残党。。。打错了很多次代码,请大家忽略这个细节。主要是图片的路径大家一定要注意。
下面是我用的图片我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)
可以用命令行测试,然后输出了一个result.txt。我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)
我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)
或者写代码
我的第一篇文章:解决Python3.8版本安装tesserocr问题(分享一下我的经验)
大概就是这样,感谢大家的阅读。我这真是死亡格式,哈哈哈。