街景字符编码识别_Task02数据读取与扩增
1 Python中读取数据的库:
- Pillow:Pillow是图像处理函式库PIL的一个分支;
官方文档:https://pillow.readthedocs.io/en/stable/ - OpenCV:包含很多图像处理功能以及图像特征处理算法,如关键点监测、边缘检测和直线检测
OpenCV官网:https://opencv.org/
2 数据扩增方法
数据扩充一般从图像的颜色、尺寸、形态、空间和像素等角度进行变换
(torchvision为例)
3 数据扩增库
- torchvision:扩充方法种类少、速度中等; https://github.com/pytorch/vision
- imagaug:扩充方法多样,组合方便速度快;
https://github.com/aleju/imgaug - albumentations:扩充方法多样,速度快,支持图像分类、予语义分割、物体检测等;