CRNN序列图像识别过程(二)

CRNN序列图像识别过程(二)
上图中纵坐标是可能出现的字符,横坐标是输出的序列,上图表示:输出结果要求为zoo时,在网络输出的序列长度为9的前提下,网络可以输出的序列情况。
从图中可以看出,第一个出现的字符为空格或者z,如果第一个字符为空格,那么第二个出现的字符可以为空格或者z,箭头表示下一个可以出现的字符情况,比如,网络输出的序列可以为:空格空格空格空格空格zo空格o或者zz空格o空格o空格空格空格
最终经过转录,可以得到zoo
在此说明一下,在网络中,每一个序列字符的输出都是有概率的,比如,在 空格空格空格空格空格zo空格o这条输出结果上看,第一个序列输出结果为空格的概率和第二个输出结果为空格的概率等都是前面经过Bi-LSTM网络获得的。
损失函数表示为:
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)
可以得到:
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)CRNN序列图像识别过程(二)
CRNN序列图像识别过程(二)