图像/图片的翻转——图像数据增强?
由上一篇说起,图像数据增强的作用到底是什么?
这其中是不是有点自欺欺人呢?这样的话肯定就是记忆了,在训练过程中肯定是acc好得不得了,如果测试集也是这样增强的,那也是好得不得了,到实际数据估计就嗝屁了;如果仅仅训练集增强,而验证集/测试集没有这样,那么效果估计不好,甚至你会怀疑过拟合了??训练集acc好啊,验证集啥也不是,差一大截。
这种情况怎么应对,且不表。待我找个实例再说,此文主要说实际识别中图像数据增强,这样会不会增加识别的acc呢?对所有结果做一个mean,就是最终结果。请看图像数据增强的一些操作,以我哥为例:【欣赏不了2000年热情演唱会的都不是真粉】
1-剪切
【看来有必要将我cv的书拿出来撕掉封面的薄膜了,已经一年了,之前买了好多书都没看】
一般可能绝大多数的图片都是0~255的,也就是8位。【我真的不想用tf来读图,或者数据处理,我觉得tf就只是深度学习的,因为它需要sess.run,处理下就需要这个玩意费劲】
tf有crop的方法我不想用,只能自己造了,小明哥造个小*还是绰绰有余。
cv的操作,CV的都不是RGB的,resize的hw。
搞定。
2-翻转[水平和上下],为了表示对我哥的充分尊重,不放倒立的图了,数据来源于此,下同
我能说cv2这玩意是个垃圾吗?动不动就变色。。。。。第4个的操作是对左边的图上下翻转,第2个图是对左边的图左右翻转,同样的操作,结果cv2就这鬼样子。卧槽。再次转成RGB的。plt和PIL都是对RGB
因为上面用的np的翻转,我试试cv2的
3-旋转角度[这个我做的不好,有阴影,稍微会点的都做的没有阴影或很少有,缩放的比例也合适]
如果是方形图则似乎没有,矩形的可能有空白
12点钟y方向逆时针旋转
4-加噪声,高斯噪声
这样算来,第一个还可以增加空白,可以是补零,可以是噪声
这样的话,原图,剪切,左右,噪声,就四个图,先这样试试看,回到博文:https://blog.****.net/SPESEG/article/details/103292299
冬天该很好
你若尚在场
天空多灰
我们亦放亮
一起坐坐谈谈来日动向
漠视外间低温
这样唱
另外有相关问题可以加入QQ群讨论,不设微信群
QQ群:868373192
语音图像深度学习群