python安装及使用tesseract识别文字
步骤:
- 下载安装tesseract
- 配置环境变量
- 安装pytesseract模块
- 修改pytsseract模块中tesseract的安装路径
- 使用
1.下载安装:要记得安装在那个地方后面配置环境变量要用
tesseract安装包地址
2.配置环境变量
目的:配置环境变量是为了在计算机中随意使用tesseract
步骤:
电脑右键点击属性
高级系统设置
环境变量
系统变量找到path点击编辑
新建环境变量:要填写你安装的tesseract的路径如下图
这样就可以在任意地方使用了:敲入tesseract -v
测试使用
在桌面新建png文件使用tesseract
输出结果保存在当前目录下result.txt中
3.安装pytesseract
直接pip install pytesseract
但是在windows中不能使用需要到第4步
4.修改文件路径
找到pytesseract的安装目录
以我的pycharm为例
找到该目录:进入lib目录
进入site-packages并找到pytesseract进入目录找到pytesseract.py
修改tesseract_cmd为tesseract的安装路径
使用
测试图片
输出部分结果