这使得CTPN可以探索丰富的图像上下文信息,使其能够检测极其模糊的文本。CTPN在多尺度和多语言文本上可靠地工作,而不需要进一步的后处理,脱离了以前的自底向上需要多步后过滤的方法。...我们利用强深度卷积特性和共享计算机制的优点,提出了如图1所示的CTPN架构。主要贡献如下: ? 图1:(a)连接文本提议网络(CTPN)的架构。...图3:上:没有RNN的CTPN。下:有RNN连接的CTPN。 受到这项工作的启发,我们认为这种上下文信息对于我们的检测任务也很重要。...通过使用单个GPU,我们的CTPN(用于整个检测处理)的执行时间为每张图像大约0.14s,固定短边为600。没有RNN连接的CTPN每张图像GPU时间大约需要0.13s。...结论 我们提出了连接文本提议网络(CTPN)—— 一种可端到端训练的高效文本检测器。CTPN直接在卷积映射的一系列细粒度文本提议中检测文本行。
=/opt/ctpn WORKDIR $CTPN_ROOT RUN git clone --depth 1 https://github.com/tianzhi0549/CTPN.git WORKDIR.../CTPN/caffe/python ENV PYTHONPATH $PYCAFFE_ROOT:$PYTHONPATH ENV PATH $CTPN_ROOT/CTPN/caffe/build/tools...RUN cp $CTPN_ROOT/CTPN/src/layers/* $CTPN_ROOT/CTPN/caffe/src/caffe/layers/ RUN cp $CTPN_ROOT/CTPN/src.../*.py $CTPN_ROOT/CTPN/caffe/src/caffe/ RUN cp -r $CTPN_ROOT/CTPN/src/utils $CTPN_ROOT/CTPN/caffe/src/...:/opt/ctpn/CTPN/models/ctpn_trained_model.caffemodel --runtime=nvidia ctpn ?
image.png 对于复杂环境中的字符的识别,主要包括文字检测和文字识别两个步骤,这里介绍的CTPN(Detecting Text in Natural Image with Connectionist...应对于此,一类结合CNN优势,专门应对环境文本信息的模型也就因运而生了,CTPN正是其中的佼佼者。 CTPN算法概述 言归正传,那么算法上文本位置的准确界定是怎么做到的呢?...说明 1.论文: https://arxiv.org/pdf/1609.03605.pdf 2.代码: https://github.com/eragonruan/text-detection-ctpn
不同于网上千篇一律讲解CTPN的文章,本文将使用大量可视化过程来帮助大家理解CTPN,完整重现CTPN所有细节。 先用一张动图过一遍CTPN全过程,接下来开始我们的讲解。 ?...我们来看一下用一般目标检测算法(Faster-RCNN)跟用CTPN效果对比,很明显通用的目标检测算法的检测框会大很多(更不精确) ?...接下来我们开始讲解CTPN具体原理,本文默认读者了解Faster-RCNN以及LSTM原理,如果不懂的可以移步我前几篇文章。 CTPN总体结构 ?...以上就是CTPN的架构,看不懂没关系,接下来我会可视化每个过程帮你了解。...这里要注意,CTPN在实际当中对一些倾斜样本的鲁棒性还是略显不足的。 损失函数 ?
作者github地址和tensorflow版本地址: 在公众号 datadw 里 回复 CTPN 即可获取。 本文将对CTPN这篇文章的思路做一个详细的介绍,同时对代码进行解读。...http://slade-ruan.me/2017/10/22/text-detection-ctpn/
论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network [Paper] [Code-Caffe...CTPN(Connectionist Text Proposal Network),end-to-end 框架: 类似于 Faster R-CNN,对 VGG16 网络输出(conv5)的卷积 feature...相同点: 均需要采用全卷积网络,允许任意尺寸的输入图片; 不同点: CTPN 通过对卷积特征图根据小窗口平滑,检测文本行;输出细尺度(如,固定宽度为 16-pixel)的文本 proposals 序列...CTPN,垂直 anchor 机制,同时预测 文本/非文本 score 和每个细尺度 proposal 的 y-轴位置: 文本 proposal 的宽度固定设定为 16 pixels(对应输入图片尺寸)...上:CTPN without RNN; 下:CTPN with RNN.
本文主要分享的是CTPN,paper名称是Detecting Text in Natural Image with Connectionist Text Proposal Network,论文链接地址:...image.png 一、 CTPN算法简介 原文中有这样一段话,讲述了通用目标检测为什么不能应用于场景文本检测的: However, it is difficult to apply these general...1.1 CTPN网络结构 CTPN的网络结构图如下: image.png 原始CTPN只检测横向排列的文字。CTPN结构与Faster R-CNN基本类似,但是加入了LSTM层。...CTPN会做如下处理: 1. Softmax判断Anchor中是否包含文本,即选出Softmax score大的正Anchor; 2.
文本区域检测网络-CTPN(CNN+RNN) 3..../ctpn/ctpn/other.py 的draw_boxes函数的最后部分, cv2.inwrite('dest_path',img),如此, 可以得到ctpn检测的文字区域框以及图像的ocr识别结果...如果你想训练这个网络 1 对ctpn进行训练 定位到路径--..../ctpn/ctpn/train_net.py 预训练的vgg网络路径VGG_imagenet.npy将预训练权重下载下来,pretrained_model指向该路径即可, 此外整个模型的预训练权重checkpoint...ctpn数据集还是百度云数据集下载完成并解压后,将.ctpn/lib/datasets/pascal_voc.py 文件中的pascal_voc 类中的参数self.devkit_path指向数据集的路径即可
150万个样本训练也没收敛,还有2.5左右的cost. 4:CTPN+CRNN整合场景文字检测识别结果 没有进行版面分析,所以识别结果没有按顺序输出 其中标点符号训练集较少,错得较多。
CTPN直接在卷积特征映射中检测一系列精细比例的文本建议中的文本行。CTPN开发了一个垂直锚定机制,可以联合预测每个固定宽度提案的位置和文本/非文本得分,大大提高了定位精度。...图片CTPN以非常深的16层vggNet(VGG16)为例来描述方法,它很容易适用于其他深度模型。CTPN的体系结构如图1....为此,CTPN建议在conv5上设计一个RNN层。图片Side-refinement:CTPN可以准确、可靠地检测到精细尺度的文本建议。...实验将CTPN和最近公布的几种方法进行了比较。如表1和表2所示, CTPN在所有五个数据集上都达到了最佳性能。在SWT上,CTPN在召回率和F-measure上都有显著的改进,在精确度上略有提高。...CTPN的检测器在多语言上对TextFlow表现良好,这表明CTPN的方法可以很好地推广到各种语言。
出现没有 No module named 'lib.utils',但是我们目录中是有utils这个包的,我们需要使用Cpython来编译,打开ctpn/lib/utils/setup_cpu.py,将里面的代码全部删掉...复制移动到:D:\chinese_ocr\ctpn\lib\utils目录下,再运行demo.py,继续报错 ModuleNotFoundError: No module named 'lib.utils.../ctpn/text.yml脚本,修改以下代码,即取消GPU ?...打开 ctpn/lib/fast_rcnn/config.py脚本,修改一下代码: ? 打开ctpn/lib/fast_rcnn/nms_wrapper.py ,删掉以下代码: ?...打开ctpn/ lib/utils/__init__.py,删掉以下代码 ? 打开ctpn\lib\utils\cython_nms.pyx,更改这一行代码 ?
在做图片文字识别的,需要用到CTPN以及crnn,服务器是ubuntu16的,但是上述两种框架(github现有的)只能运行在ubuntu14上面。...crnn的docker安装是在CTPN的docker的基础上面安装。...*/return THTensor_(prod)(r, t, dim,1);/' detail/TensorGeneric.h docker文件如下: # 基于前面的CTPN FROM ctpn_docker
imread('demo.jpg') r = sess.run(img) print('result:',r,'type',type(r)) 其中Model_Docker是这样的: class CTPN_Docker...imgstr = img.tobytes() shape = json.dumps(img.shape) stub = ctpn_pb2_grpc.ModelStub(grpc.insecure_channel...('localhost:50051')) response = stub.predict(ctpn_pb2.rect_request(img=imgstr, shape=shape))...就拿现在我在做的目标检测和文字识别的几个模型来说,yolo、fasterrcnn、ctpn和crnn等都是这样。...这还不是最毒瘤的,较新的ctpn是继承自fasterrcnn,也是采用这种方法.
1、CTPN原理——文字检测 1.1、简介 ? CTPN是在ECCV 2016提出的一种文字检测算法。...1.2、CTPN模型创新点 ? CTPN的创新点主要由以下三点: (1)、将文本行拆分为slice进行检测,这样在检测过程中只需要对文本的高度进行先验性的设置anchor。...1.3、CTPN与RPN网络结构的差异 ? ? 如上图所示,左图为RPN,右图为CTPN的网络结构。...原始CTPN只检测横向排列的文字。CTPN结构与Faster R-CNN基本类似,但是加入了LSTM层(CNN学习的是感受野内的空间信息,LSTM学习的是序列特征。...1.9、CTPN小结 ? 1.由于加入LSTM,所以CTPN对水平文字检测效果超级好。
模型资源站收录情况 模型来源论文 CTPN https://sota.jiqizhixin.com/project/ctpn收录实现数量:3支持框架:PyTorch、TensorFlow Detecting...一、文本检测模型 1、 CTPN CTPN( Connectionist Text Proposal Network )是在ECCV 2016中提出的一种文本检测模型。...CTPN是基于Anchor的算法,在检测横向分布的文字时能得到较好的效果。CTPN结构与Faster R-CNN基本类似,但是加入了LSTM层。...(b)CTPN输出连续的固定宽度的细刻度文本建议。每个box的颜色表示文本/非文本得分。...平台项目详情页 CTPN 前往 SOTA!
深度学习应用篇-计算机视觉-OCR光学字符识别7:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景 1.OCR综述 OCR(Optical Character Recognition...图片 2.OCR检测方法 2.1 CTPN CTPN(Connectionist Text Proposal Network)1是目标检测算法Faster R-CNN 的改进算法,...2.1.1CTPN模型结构 CTPN采用的方法是将文本行分割成一个个小块(长度是固定的),然后去检测这些小块,最后使用一种文本行构造法将所有块连起来,如 图1 所示。...图片 图1 CTPN 序列特征 CTPN网络结构如 图2 所示: 图片 图2 CTPN网络结构示意图</center...但是对于竖直方向的文本,或者多方向的文本,CTPN检测就很差。
CTPN(2016) 1)概述 CTPN全称Detecting Text in Natural Image with Connectionist Text Proposal Network(基于连接文本提议网络的自然图像文本检测...2)具体步骤 CTPN主要包含以下几个步骤: 检测文本。...3)网络结构 VGG16+Conv5:CTPN的基础网络使用了VGG16用于特征提取,在VGG的最后一个卷积层Conv5,CTPN用了3×3的卷积核来对该feature map做卷积,这个Conv5...5)性能 ① 时间性能 使用单个GPU,CTPN(用于整个检测处理)的执行时间为每张图像大约0.14s。没有RNN连接的CTPN每张图像GPU时间大约需要0.13s。...② 准确率 CTPN在自然环境下的文字检测中取得了优异的效果。如下图所示: CTPN在五个基准数据集上进行了全面评估。
由于受控场景的文字受诸多先验的约束条件约束,本身的文本复杂度较低(水平文本,文本偏转角度小等),我们选择选择通用的文本检测模型CTPN[7]进行文本框的检测。...3.1.1 受控场景的文本检测 对于受控场景,我们直接使用文本检测模型CTPN对用户上传的证件进行文本框的检测。 ?...图3 基于CTPN模型的文本框检测结构[7] 除对模型的输入进行前期处理之外,还在CTPN模型的训练过程上进行改进,考虑到人工去标定样本的成本是很高的,同时为了让模型在真实环境中表现出较好的性能,我们采用由糙到精的训练步骤...将CTPN模型运用在对营业执照的文字检测上,目前F1分数值能够达到89%。...我们将该文本识别模型与CTPN模型整合,对营业执照重要字段文本内容进行识别,目前在印章,反光等多种因素干扰情况下,对统一社会信用编码等的全字段识别精度能达到85%。
这与去年经典的CTPN架构类似。不过CTPN只支持水平方向,而EAST在论文中指出是可以支持多方向文本的定位的。 ? 论文采用的架构如下: ?...不过最后一张图实在过于复杂,包括CTPN的效果也都是非常一般。利用百度识别SDK也测试了下,结果也是差不多。 ?
目前已经有很多文字检测方法,包括:EAST/CTPN/SegLink/PixelLink/TextBoxes/TextBoxes++/TextSnake/MSR/......,具体来说: 2.1.1 CTPN [1] CTPN是ECCV 2016提出的一种文字检测算法,由Faster RCNN改进而来,结合了CNN与LSTM深度网络,其支持任意尺寸的图像输入,并能够直接在卷积层中定位文本行...CTPN由检测小尺度文本框、循环连接文本框、文本行边细化三个部分组成,具体实现流程为: 1、使用VGG16网络提取特征,得到conv5_3的特征图; 2、在所得特征图上使用3*3滑动窗口进行滑动,得到相应的特征向量...CTPN是基于Anchor的算法,在检测横向分布的文字时能得到较好的效果。此外,BLSTM的加入也进一步提高了其检测能力。
领取专属 10元无门槛券
手把手带您无忧上云