十八: 图片文字识别
1 识别步骤
<1> 原始图片
<2> 文字侦测(Text detection) : 从复杂图片中提取文字
<3> 字符拆分(Character segmentation) :将文字拆分为字符
<4> 字符分类(Character classification):确认单一字符的意义
2 滑动窗口
从图像中识别对象的技术,以人物识别为例,过程如下;
首先,需要使用大量图片训练出人物识别模型;
将图片按模型尺寸依次裁剪并作为模型参数去识别;
按比例放大尺寸,将图片按新尺寸依次裁剪,将裁剪区域按比例缩小并作为模型参数去识别;
循环上述步骤;
获取大数据方法:
1. 人工数据合成
2. 手动收集、标记数据
3. 众包
3 上限分析
以文字识别流程为例,每一步的输出为下一步的输入,我们可以通过上限分析来决定哪一步值得耗费精力去学习改善,
具体步骤为:对第N步测试,在第N步手工取100%准确的数据,观察最终结果准确率的提高比,提高比越高,则意味着
我们可以在这一步花费更多的精力去改善;