水表识别
水表识别的问题:
1. 首先我把3月15 号的数据跟7月27号的数据合在一起训,总共三万五千张样本。
用原来的网络训练。发现最后的精度只有90% 左右,查看错误的原因。
发现
图片是这样的,但是7月27号来的这批图片是:
所以这两个图片是不能一起训练的。
发现的问题是:3W多张训练样本里面有3000 多张样本识别错误,其实看acc 精度已经到1了
后来就把7月27号的样本,用原来的模型训练(第一层卷积核是5*5的)发现的问题是:
对于一万五千张样本里面,还是有930 张左右,是出现第一个数字会分错的情况。
分析结果如下:
之前的数据因为倾斜的原因:可能需要大的卷积核。比如5*5 的,但是数据调整过之后,第一个数字被识别错误是不是因为卷积核太大,把他们卷积没有了。
导致的这个问题。
现在在7月27号的数据上测试,全对。
在内窥镜的数据上测试 共有1432,
内窥镜的数据与训练集是互斥的,不是一批数据
对于检测到四位数水表数据,前面四位还能识别正确。觉得很难得
下面是识别不对的所有数据。第一个识别不对正常,第二个大概是因为第一位数据为2 的数据量不够
第三个不对暂时不清楚原因。第四个算识别正确,因为人眼也看不清楚最后的数字是个啥。
第五个不对也是可以原谅,第六个是6位数的水表,暂时不支持。
第七个是跟第二个的不正确的原因类似、(1432-13)/1432>99% 暂时是这个网络