darknet 文字识别铺垫工作

        今天记录一下使用深度学习进行文字识别的铺垫工作,文字识别训练库的自动生成。文字识别图像识别引擎使用darknet,原因不解释。工欲善其事,必先做准备。

         针对文字识别问题,目前考虑使用YOLOv3模型进行识别分类,在YOLOv3基础上进行网络优化。该项研究工作,计划分为三步走,第一步首先模拟大量目标数据,第二步使用YOLOv3对5000个常用汉字进行分类识别,分析分类识别的精度效果,然后结合相关文字识别方法对YOLOv3网络进行改进。第三步使用改进后的网络进行测试,确定适合多种文字单独识别的实时检测识别方法。简要说明如图,目前第一步工作基本完成,如图2所示,首次选取108个汉字,含阿拉伯数字,生成10800张模拟样本数据,这些文字数据随机使用黑、白、红、彩色以不同字体大小进行生成。

darknet 文字识别铺垫工作

图2 汉字识别数据模拟

能生成模拟数据,就也能生成训练所需的文件,需要来要,来合作。可悲的是训练用的服务器抛锚了,返修中。。。。希望有同志一起研究,改进深度学习在文字认知方面的应用。什么CTPN,暴力一点,直接一个字一个字的认识,然后恢复其语义关系。