街景字符编码识别_Task02数据读取与扩增

1 Python中读取数据的库:

  • Pillow:Pillow是图像处理函式库PIL的一个分支;
    官方文档:https://pillow.readthedocs.io/en/stable/
  • OpenCV:包含很多图像处理功能以及图像特征处理算法,如关键点监测、边缘检测和直线检测
    OpenCV官网:https://opencv.org/

2 数据扩增方法

数据扩充一般从图像的颜色、尺寸、形态、空间和像素等角度进行变换
(torchvision为例)街景字符编码识别_Task02数据读取与扩增

3 数据扩增库

  • torchvision:扩充方法种类少、速度中等; https://github.com/pytorch/vision
  • imagaug:扩充方法多样,组合方便速度快;
    https://github.com/aleju/imgaug
  • albumentations:扩充方法多样,速度快,支持图像分类、予语义分割、物体检测等;