什么是OCR
1)定义
OCR (Optical Character Recognition,光学字符识别)是指对图片中的文字进行查找、提取、识别的一种技术,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程...循环层预测特征序列x=x1,…,xTx = x_1,…,x_Tx=x1,…,xT中每一帧xtx_txt的标签分布yty_tyt。循环层的优点是三重的。...在基于词典的模式中,通过选择具有最高概率的标签序列进行预测。
① 标签序列的概率
采用”联接时间分类“(CTC)层中定义的条件概率。...按照每帧预测y=y1,…,yTy=y_1,…,y_Ty=y1,…,yT对标签序列lll定义概率,并忽略lll中每个标签所在的位置。...目标函数直接从图像和它的真实标签序列计算代价值。因此,网络可以在成对的图像和序列上进行端对端训练,去除了在训练图像中手动标记所有单独组件的过程。
网络使用随机梯度下降(SGD)进行训练。