基于pytorch的OCR识别库
基于pytorch的OCR识别库
对一年来学习的算法做了一个整理,同时也方便使用(项目持续更新中)
识别库的地址: github地址
这里支持的算法包括:
DBnet 论文链接
PSEnet 论文链接
PANnet 论文链接
SASTnet 论文链接
CRNN 论文链接
这里做了什么:
- 对上面算法进行了实现和实验
- 提供各个算法的训练和测试接口
- 提供各个算法的预训练模型
- 支持pytorch转成onnx,及onnx调用
接下来会做什么:
- 提供onnx转tensorrt的python接口,及调用
- 训练通用ocr的检测和识别模型,提供预训练模型和inference模型
- 模型压缩,进一步缩小模型大小
- 模型蒸馏,提升模型准确率
- tensorrt部署
- 手机端部署
效果:
最后,感谢各位论文作者的辛勤付出