小巧免费的图片文字识别OCR软件 支持简体以及手写体识别和竖排繁体中文
本软件程序支持简体中文识别和繁体中文横排和竖排的识别。
最新升级1.5.3版,新增截屏和图片旋转任意角度调整功能,支持高精度识别更少错别字,支持批量识别,新增手写体识别和生僻字识别,新增了对png和gif的支持,可文本朗读并保存为MP3;对竖排繁体添加了列号,并支持自动合并和倒序,大幅提高文稿质量较差时的编辑效率。
特色功能:
1.使用百度深度学习技术,识别正确率高。
2.一键繁简转换
3.一键错字替换,因为OCR识别出来总是会有一些固定误识的字,使用自定义替换表,可以提高工作效率。
4.双击恢复替换的字,有时10个里面有3个是不需要替换的,那么整体替换后,这三个双击鼠标可以复原。
5.体积小,免安装,使用简单。
横排文字的识别很简单,只需直接“打开图片”或者从剪贴板“粘贴图片”,然后点击“开始识别”按钮就能识别出来了。
然后繁体转简体,在右边下部的文本框内选中要转换的内容,然后点击“简繁”按钮就会在简体和繁体之间自动转换。
另外如果是竖排从右向左读的文字,那么识别设置要麻烦一些,请看如下使用说明。
前段时间想把一本竖排繁体中文的古书想转换成简体中文。从网上下载了汉王7600的识别程序,能识别竖排的,但识别率太低,只有不到一成。又网上找了其他的识别程序,发现没有合适的。正好看到百度有个图片ocr识别功能,能识别繁体字,识别率还可以,不是很清楚的图片也能达到九成左右。但百度提供的网页上不能识别竖排的,全部按横排识别。于是自己写了个小程序,调用百度的识别API,然后把图片自动切割成竖的一条条的来提交识别。识别好后再倒叙排一下。基本解决了这个问题。
现把程序贡献出来,供有需要的朋友使用。不过百度目前有每天免费识别500次的限额,满了后就要第二天识别了。
识别程序大小约2M,最新1.5.3版,下载地址:https://pan.baidu.com/s/1dDIPA2lbQFglbQbmJ484nw
使用教程(竖排繁体字请看教程,横排的不论简体还是繁体,操作简单就两步,1粘贴图片,2开始识别。不看教程也会用)
另外,竖排繁体可以先粘贴或者打开图片后按“开始识别”按钮识别试试,如果能自动识别出是竖排文字的,也不需看下面的打标线教程了。(注意,就算认识竖排,也是按从左到右识别的,在识别完成后需点按右下角的”倒序粘贴“按钮来排列为从右到左的顺序),然后识别出来的一列可能会被拆成几行,需要手工编辑为一行。然后再倒序。
对于把竖排识别为横排文字的,继续往下看,1.程序启动后的界面
2.打开图片,或者从屏幕上截图,对于拍摄不是很平整的图片,可以分几块截图,分几次识别
截图后粘贴图片
3.粘贴好后如图:
4.点击 自动 按钮,来给竖排文本打标线,如果线条没有打出来或者只有一条,那么调整 “自动” 按钮前面的数字,默认是170,对于颜色深的图片可以调整到 100试试,这个数字越小表示空白部分的颜色越深。如图这个颜色深度,调整到120后标线就画出来了。
自动打的标线经常会位置不正确,会压到字,需要手工调整
调整水平起点和水平间隔的数字大小,使红色的线条位于文字的中间
5. 勾选 竖排按列提交,然后点击开始识别 按钮
6.这是按从左到右识别出来的文本
7.勾选自动替换错别字,替换的内容在 “错字替换.txt” 文件内,用记事本打开就可以修改。每组一行,错别字=正确的字 这样的格式
然后点击 “倒叙粘贴” 按钮,从上面倒叙复制到下面的窗口
8.完工
程序最新1.5.1版,可以从百度网盘下载:https://pan.baidu.com/s/1dDIPA2lbQFglbQbmJ484nw
默认每天普通识别免费500次(单用户),高精度识别每天免费500次(全用户累计)。
(每天识别量500次内的用户可忽略以下内容)
如需大批量识别的用户建议自己申请免费的百度账号,贴吧,知道,文档等账号通用。方法如下:
登录百度云,网址:https://console.bce.baidu.com
然后转到文字识别:https://console.bce.baidu.com/ai/#/ai/ocr/overview/index
然后创建一个应用,创建好后进入管理应用,https://console.bce.baidu.com/ai/#/ai/ocr/app/list
即可看到 API Key 和 Secret Key
把这两个填入程序内即可使用你自己的账号了。
如图1,打开独立接口添加页面:
图2:
输入api key 和secret key后请点击保存按钮。
如果您电脑是XP系统,上述程序运行后报错,那么可以试试下载这个xp老版本
另外经过实测是否勾选“生僻字识别” 识别出来没什么区别。所以这个生僻字识别功能就去掉了。