Keras 大坑解决之:fit_generator 停不下来的问题
场景
今天下午用 vgg-16 来训练 mnist 网络:
- 50000 个 sample
- 1 个 epoch
- batchsize = 64
- 使用 2 个 gpu 1080 ti显卡,跑了一下午就是停不下来了
问题呈现
- 看这里该死的 unknown,一眼望不到头,训练了 20多万个 step 就是停不下来
原因分析
因为使用的 fit_generator 来训练,这本质是一个生成器,所以如果不指定每个 epoch 的训练步数 step 他就会无限循环下去·····,以至于我跑了一下午,精度到了 99% 也根本停不下来。
问题解决
- 在 fit_generator 中添加一个限定:
steps_per_epoch = ..
*亲切的进度条又回来了,我又开心了~~~~*,顺顺利利训练完成