darknet 文字识别铺垫工作

今天记录一下使用深度学习进行文字识别的铺垫工作，文字识别训练库的自动生成。文字识别图像识别引擎使用darknet，原因不解释。工欲善其事，必先做准备。

针对文字识别问题，目前考虑使用YOLOv3模型进行识别分类，在YOLOv3基础上进行网络优化。该项研究工作，计划分为三步走，第一步首先模拟大量目标数据，第二步使用YOLOv3对5000个常用汉字进行分类识别，分析分类识别的精度效果，然后结合相关文字识别方法对YOLOv3网络进行改进。第三步使用改进后的网络进行测试，确定适合多种文字单独识别的实时检测识别方法。简要说明如图，目前第一步工作基本完成，如图2所示，首次选取108个汉字，含阿拉伯数字，生成10800张模拟样本数据，这些文字数据随机使用黑、白、红、彩色以不同字体大小进行生成。

darknet 文字识别铺垫工作

图2 汉字识别数据模拟

能生成模拟数据，就也能生成训练所需的文件，需要来要，来合作。可悲的是训练用的服务器抛锚了，返修中。。。。希望有同志一起研究，改进深度学习在文字认知方面的应用。什么CTPN，暴力一点，直接一个字一个字的认识，然后恢复其语义关系。

darknet 文字识别铺垫工作

相关推荐