图像/图片的翻转——图像数据增强?

上一篇说起,图像数据增强的作用到底是什么?

这其中是不是有点自欺欺人呢?这样的话肯定就是记忆了,在训练过程中肯定是acc好得不得了,如果测试集也是这样增强的,那也是好得不得了,到实际数据估计就嗝屁了;如果仅仅训练集增强,而验证集/测试集没有这样,那么效果估计不好,甚至你会怀疑过拟合了??训练集acc好啊,验证集啥也不是,差一大截。

这种情况怎么应对,且不表。待我找个实例再说,此文主要说实际识别中图像数据增强,这样会不会增加识别的acc呢?对所有结果做一个mean,就是最终结果。请看图像数据增强的一些操作,以我哥为例:【欣赏不了2000年热情演唱会的都不是真粉】

1-剪切

【看来有必要将我cv的书拿出来撕掉封面的薄膜了,已经一年了,之前买了好多书都没看】

一般可能绝大多数的图片都是0~255的,也就是8位。【我真的不想用tf来读图,或者数据处理,我觉得tf就只是深度学习的,因为它需要sess.run,处理下就需要这个玩意费劲】

tf有crop的方法我不想用,只能自己造了,小明哥造个小*还是绰绰有余。

图像/图片的翻转——图像数据增强?

cv的操作,CV的都不是RGB的,resize的hw。

搞定。

图像/图片的翻转——图像数据增强?

2-翻转[水平和上下],为了表示对我哥的充分尊重,不放倒立的图了,数据来源于此,下同

图像/图片的翻转——图像数据增强?

 

我能说cv2这玩意是个垃圾吗?动不动就变色。。。。。第4个的操作是对左边的图上下翻转,第2个图是对左边的图左右翻转,同样的操作,结果cv2就这鬼样子。卧槽。再次转成RGB的。plt和PIL都是对RGB

 

因为上面用的np的翻转,我试试cv2的

图像/图片的翻转——图像数据增强?

 

3-旋转角度[这个我做的不好,有阴影,稍微会点的都做的没有阴影或很少有,缩放的比例也合适]

如果是方形图则似乎没有,矩形的可能有空白

12点钟y方向逆时针旋转

图像/图片的翻转——图像数据增强?

4-加噪声,高斯噪声

图像/图片的翻转——图像数据增强?

这样算来,第一个还可以增加空白,可以是补零,可以是噪声

图像/图片的翻转——图像数据增强?

这样的话,原图,剪切,左右,噪声,就四个图,先这样试试看,回到博文https://blog.****.net/SPESEG/article/details/103292299

 

冬天该很好

你若尚在场

天空多灰

我们亦放亮

一起坐坐谈谈来日动向

漠视外间低温

这样唱

 

另外有相关问题可以加入QQ群讨论,不设微信群

QQ群:868373192 

语音图像深度学习群