十八: 图片文字识别

1 识别步骤

         十八: 图片文字识别

<1> 原始图片

<2> 文字侦测(Text detection) :  从复杂图片中提取文字

<3>  字符拆分(Character segmentation) :将文字拆分为字符

<4>  字符分类(Character classification):确认单一字符的意义

 

2 滑动窗口

从图像中识别对象的技术,以人物识别为例,过程如下;

首先,需要使用大量图片训练出人物识别模型;

将图片按模型尺寸依次裁剪并作为模型参数去识别;

按比例放大尺寸,将图片按新尺寸依次裁剪,将裁剪区域按比例缩小并作为模型参数去识别;

循环上述步骤;

                   十八: 图片文字识别

获取大数据方法:

  1. 人工数据合成
  2. 手动收集、标记数据
  3. 众包


3 上限分析

以文字识别流程为例,每一步的输出为下一步的输入,我们可以通过上限分析来决定哪一步值得耗费精力去学习改善,

具体步骤为:对第N步测试,在第N步手工取100%准确的数据,观察最终结果准确率的提高比,提高比越高,则意味着

我们可以在这一步花费更多的精力去改善;