tesserocr安装
tesserocr安装
1.OCR,光学识别符。
tesserocr是Python的一个OCR库,但其实是对tesseract做的一层Python APIde 封装,所以他的核心是tesseract。因此,在安装tesserocr之前,我们需要先安装tesseract。
2.相关链接
1.tesserocr包下载地址,GitHub
2.tesseract包下载地址
3.安装
1.点击下载tesseract-ocr-setup-3.05.01.exe
2.下载完成后双击,勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言,然后一路点击Next按钮。(注:安装路径最好放在Python文件下,我的是C:\Python3.6)
3.点击下载tesserocr并在当前路径下进入终端;安装,在终端输入:
pip install tesserocr-2.4.0-cp36-cp36m-win_amd64.whl
4.验证
我们用tesserocr验证,首先将图片保存下来命名为code.png;然后运行以下代码:
import tesserocr
from PIL import Image
image = Image.open(‘code.jpg’)
print(tesserocr.image_to_text(image))
输出结果:
Python3WebSpider
如果输出成功。则证明tesserocr都已经安装成功。