您的位置: 首页 > 文章 > Python + tesseract 进行文字识别 Python + tesseract 进行文字识别 分类: 文章 • 2023-12-15 09:52:10 效果: 介绍: 这是基于Tesseract的OCR识别,设置中文包属性", lang=‘chi_sim’",程序没做界面 ,只是用递归方法遍历文件夹内所有文件和文件夹,在程序旁边的result文件夹内以相同文件结构放入识别结果。 效果对比: 类型 原图 识别效果 代码 白底黑字的长图 有些颜色的 黑白分明的文字那是没啥问题的 字迹清晰,尽量减少干扰像素是比较好的 英文的话就本身是识别器的强项了 宋体的中文也是可以的 花语