ctpn - 腾讯云开发者社区

这使得CTPN可以探索丰富的图像上下文信息，使其能够检测极其模糊的文本。CTPN在多尺度和多语言文本上可靠地工作，而不需要进一步的后处理，脱离了以前的自底向上需要多步后过滤的方法。...我们利用强深度卷积特性和共享计算机制的优点，提出了如图1所示的CTPN架构。主要贡献如下： ? 图1：（a）连接文本提议网络（CTPN）的架构。...图3：上：没有RNN的CTPN。下：有RNN连接的CTPN。受到这项工作的启发，我们认为这种上下文信息对于我们的检测任务也很重要。...通过使用单个GPU，我们的CTPN（用于整个检测处理）的执行时间为每张图像大约0.14s，固定短边为600。没有RNN连接的CTPN每张图像GPU时间大约需要0.13s。...结论我们提出了连接文本提议网络（CTPN）—— 一种可端到端训练的高效文本检测器。CTPN直接在卷积映射的一系列细粒度文本提议中检测文本行。

1.3K1 0

CTPN dockernvidia-docker 安装

=/opt/ctpn WORKDIR $CTPN_ROOT RUN git clone --depth 1 https://github.com/tianzhi0549/CTPN.git WORKDIR.../CTPN/caffe/python ENV PYTHONPATH $PYCAFFE_ROOT:$PYTHONPATH ENV PATH $CTPN_ROOT/CTPN/caffe/build/tools...RUN cp $CTPN_ROOT/CTPN/src/layers/* $CTPN_ROOT/CTPN/caffe/src/caffe/layers/ RUN cp $CTPN_ROOT/CTPN/src.../*.py $CTPN_ROOT/CTPN/caffe/src/caffe/ RUN cp -r $CTPN_ROOT/CTPN/src/utils $CTPN_ROOT/CTPN/caffe/src/...:/opt/ctpn/CTPN/models/ctpn_trained_model.caffemodel --runtime=nvidia ctpn ?

6963 0

您找到你想要的搜索结果了吗？

是的

没有找到

深度解析文本检测网络CTPN

不同于网上千篇一律讲解CTPN的文章，本文将使用大量可视化过程来帮助大家理解CTPN，完整重现CTPN所有细节。先用一张动图过一遍CTPN全过程，接下来开始我们的讲解。 ?...我们来看一下用一般目标检测算法(Faster-RCNN)跟用CTPN效果对比，很明显通用的目标检测算法的检测框会大很多（更不精确） ?...接下来我们开始讲解CTPN具体原理，本文默认读者了解Faster-RCNN以及LSTM原理，如果不懂的可以移步我前几篇文章。 CTPN总体结构 ?...以上就是CTPN的架构，看不懂没关系，接下来我会可视化每个过程帮你了解。...这里要注意，CTPN在实际当中对一些倾斜样本的鲁棒性还是略显不足的。损失函数 ?

1.7K2 0

场景文本检测—CTPN算法介绍

image.png 对于复杂环境中的字符的识别，主要包括文字检测和文字识别两个步骤，这里介绍的CTPN(Detecting Text in Natural Image with Connectionist...应对于此，一类结合CNN优势，专门应对环境文本信息的模型也就因运而生了，CTPN正是其中的佼佼者。 CTPN算法概述言归正传,那么算法上文本位置的准确界定是怎么做到的呢？...说明 1.论文： https://arxiv.org/pdf/1609.03605.pdf 2.代码： https://github.com/eragonruan/text-detection-ctpn

19.6K6 1

深度学习CTPN算法的解读与tensorflow实现

作者github地址和tensorflow版本地址：在公众号 datadw 里回复 CTPN 即可获取。本文将对CTPN这篇文章的思路做一个详细的介绍，同时对代码进行解读。...http://slade-ruan.me/2017/10/22/text-detection-ctpn/

2.3K4 0

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network [Paper] [Code-Caffe...CTPN(Connectionist Text Proposal Network)，end-to-end 框架：类似于 Faster R-CNN，对 VGG16 网络输出(conv5)的卷积 feature...相同点：均需要采用全卷积网络，允许任意尺寸的输入图片；不同点： CTPN 通过对卷积特征图根据小窗口平滑，检测文本行；输出细尺度(如，固定宽度为 16-pixel)的文本 proposals 序列...CTPN，垂直 anchor 机制，同时预测文本/非文本 score 和每个细尺度 proposal 的 y-轴位置：文本 proposal 的宽度固定设定为 16 pixels(对应输入图片尺寸)...上：CTPN without RNN；下：CTPN with RNN.

9792 0

03.OCR学习路径之文本检测（中）CTPN算法简介

本文主要分享的是CTPN，paper名称是Detecting Text in Natural Image with Connectionist Text Proposal Network，论文链接地址：...image.png 一、 CTPN算法简介原文中有这样一段话，讲述了通用目标检测为什么不能应用于场景文本检测的： However, it is difficult to apply these general...1.1 CTPN网络结构 CTPN的网络结构图如下： image.png 原始CTPN只检测横向排列的文字。CTPN结构与Faster R-CNN基本类似，但是加入了LSTM层。...CTPN会做如下处理： 1. Softmax判断Anchor中是否包含文本，即选出Softmax score大的正Anchor； 2.

2K2 0

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

文本区域检测网络-CTPN(CNN+RNN) 3..../ctpn/ctpn/other.py 的draw_boxes函数的最后部分， cv2.inwrite('dest_path',img)，如此，可以得到ctpn检测的文字区域框以及图像的ocr识别结果...如果你想训练这个网络 1 对ctpn进行训练定位到路径--..../ctpn/ctpn/train_net.py 预训练的vgg网络路径VGG_imagenet.npy将预训练权重下载下来，pretrained_model指向该路径即可, 此外整个模型的预训练权重checkpoint...ctpn数据集还是百度云数据集下载完成并解压后，将.ctpn/lib/datasets/pascal_voc.py 文件中的pascal_voc 类中的参数self.devkit_path指向数据集的路径即可

2.5K4 0

深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)

150万个样本训练也没收敛，还有2.5左右的cost. 4:CTPN+CRNN整合场景文字检测识别结果没有进行版面分析，所以识别结果没有按顺序输出其中标点符号训练集较少，错得较多。

8.4K5 0

【文本检测与识别-白皮书-3.1】第三节：算法模型 2

CTPN直接在卷积特征映射中检测一系列精细比例的文本建议中的文本行。CTPN开发了一个垂直锚定机制，可以联合预测每个固定宽度提案的位置和文本/非文本得分，大大提高了定位精度。...图片CTPN以非常深的16层vggNet（VGG16）为例来描述方法，它很容易适用于其他深度模型。CTPN的体系结构如图1....为此，CTPN建议在conv5上设计一个RNN层。图片Side-refinement:CTPN可以准确、可靠地检测到精细尺度的文本建议。...实验将CTPN和最近公布的几种方法进行了比较。如表1和表2所示， CTPN在所有五个数据集上都达到了最佳性能。在SWT上，CTPN在召回率和F-measure上都有显著的改进，在精确度上略有提高。...CTPN的检测器在多语言上对TextFlow表现良好，这表明CTPN的方法可以很好地推广到各种语言。

5212 0

CV学习笔记（十六）：Windows环境复现ChineseOCR

出现没有 No module named 'lib.utils'，但是我们目录中是有utils这个包的，我们需要使用Cpython来编译，打开ctpn/lib/utils/setup_cpu.py，将里面的代码全部删掉...复制移动到：D:\chinese_ocr\ctpn\lib\utils目录下,再运行demo.py，继续报错 ModuleNotFoundError: No module named 'lib.utils.../ctpn/text.yml脚本，修改以下代码，即取消GPU ?...打开 ctpn/lib/fast_rcnn/config.py脚本，修改一下代码： ? 打开ctpn/lib/fast_rcnn/nms_wrapper.py ，删掉以下代码: ?...打开ctpn/ lib/utils/__init__.py，删掉以下代码 ? 打开ctpn\lib\utils\cython_nms.pyx，更改这一行代码 ?

1.2K3 0

【项目实践】中英文文字检测与识别项目（CTPN+CRNN+CTC Loss原理讲解）

1、CTPN原理——文字检测 1.1、简介 ? CTPN是在ECCV 2016提出的一种文字检测算法。...1.2、CTPN模型创新点 ? CTPN的创新点主要由以下三点： (1)、将文本行拆分为slice进行检测，这样在检测过程中只需要对文本的高度进行先验性的设置anchor。...1.3、CTPN与RPN网络结构的差异 ? ? 如上图所示，左图为RPN，右图为CTPN的网络结构。...原始CTPN只检测横向排列的文字。CTPN结构与Faster R-CNN基本类似，但是加入了LSTM层（CNN学习的是感受野内的空间信息，LSTM学习的是序列特征。...1.9、CTPN小结 ? 1.由于加入LSTM，所以CTPN对水平文字检测效果超级好。

4.4K3 1

crnn dockernvidia-docker 安装

在做图片文字识别的，需要用到CTPN以及crnn，服务器是ubuntu16的，但是上述两种框架(github现有的)只能运行在ubuntu14上面。...crnn的docker安装是在CTPN的docker的基础上面安装。...*/return THTensor_(prod)(r, t, dim,1);/' detail/TensorGeneric.h docker文件如下: # 基于前面的CTPN FROM ctpn_docker

1.1K1 0

利用docker部署深度学习模型的一个最佳实践

imread('demo.jpg') r = sess.run(img) print('result:',r,'type',type(r)) 其中Model_Docker是这样的： class CTPN_Docker...imgstr = img.tobytes() shape = json.dumps(img.shape) stub = ctpn_pb2_grpc.ModelStub(grpc.insecure_channel...('localhost:50051')) response = stub.predict(ctpn_pb2.rect_request(img=imgstr, shape=shape))...就拿现在我在做的目标检测和文字识别的几个模型来说，yolo、fasterrcnn、ctpn和crnn等都是这样。...这还不是最毒瘤的，较新的ctpn是继承自fasterrcnn，也是采用这种方法.

2.1K1 1

CTPN、TextBoxes、SegLink、RRPN、FTSN、DMPNet…你都掌握了吗？一文总结OCR必备经典模型（一）

模型资源站收录情况模型来源论文 CTPN https://sota.jiqizhixin.com/project/ctpn收录实现数量：3支持框架：PyTorch、TensorFlow Detecting...一、文本检测模型 1、 CTPN CTPN（ Connectionist Text Proposal Network ）是在ECCV 2016中提出的一种文本检测模型。...CTPN是基于Anchor的算法，在检测横向分布的文字时能得到较好的效果。CTPN结构与Faster R-CNN基本类似，但是加入了LSTM层。...(b)CTPN输出连续的固定宽度的细刻度文本建议。每个box的颜色表示文本/非文本得分。...平台项目详情页 CTPN 前往 SOTA！

5453 0

深度学习应用篇-计算机视觉-OCR光学字符识别：OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景

深度学习应用篇-计算机视觉-OCR光学字符识别7：OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景 1.OCR综述 OCR(Optical Character Recognition...图片 2.OCR检测方法 2.1 CTPN CTPN(Connectionist Text Proposal Network)1是目标检测算法Faster R-CNN 的改进算法，...2.1.1CTPN模型结构 CTPN采用的方法是将文本行分割成一个个小块（长度是固定的），然后去检测这些小块，最后使用一种文本行构造法将所有块连起来，如图1 所示。...图片图1 CTPN 序列特征 CTPN网络结构如图2 所示：图片图2 CTPN网络结构示意图CTPN检测就很差。

3.2K0 0

【深度学习】光学字符识别（OCR）

CTPN（2016） 1）概述 CTPN全称Detecting Text in Natural Image with Connectionist Text Proposal Network（基于连接文本提议网络的自然图像文本检测...2）具体步骤 CTPN主要包含以下几个步骤：检测文本。...3）网络结构 VGG16+Conv5：CTPN的基础网络使用了VGG16用于特征提取，在VGG的最后一个卷积层Conv5，CTPN用了3×3的卷积核来对该feature map做卷积，这个Conv5...5）性能 ① 时间性能使用单个GPU，CTPN（用于整个检测处理）的执行时间为每张图像大约0.14s。没有RNN连接的CTPN每张图像GPU时间大约需要0.13s。...② 准确率 CTPN在自然环境下的文字检测中取得了优异的效果。如下图所示： CTPN在五个基准数据集上进行了全面评估。

6.6K1 0

干货 | OCR技术在携程业务中的应用

由于受控场景的文字受诸多先验的约束条件约束，本身的文本复杂度较低（水平文本，文本偏转角度小等），我们选择选择通用的文本检测模型CTPN[7]进行文本框的检测。...3.1.1 受控场景的文本检测对于受控场景，我们直接使用文本检测模型CTPN对用户上传的证件进行文本框的检测。 ?...图3 基于CTPN模型的文本框检测结构[7] 除对模型的输入进行前期处理之外，还在CTPN模型的训练过程上进行改进，考虑到人工去标定样本的成本是很高的，同时为了让模型在真实环境中表现出较好的性能，我们采用由糙到精的训练步骤...将CTPN模型运用在对营业执照的文字检测上，目前F1分数值能够达到89%。...我们将该文本识别模型与CTPN模型整合，对营业执照重要字段文本内容进行识别，目前在印章，反光等多种因素干扰情况下，对统一社会信用编码等的全字段识别精度能达到85%。

1.7K5 0

EAST 自然场景文本检测实践(EAST: An Efficient and Accurate Scene Text Detector)

这与去年经典的CTPN架构类似。不过CTPN只支持水平方向，而EAST在论文中指出是可以支持多方向文本的定位的。 ? 论文采用的架构如下： ?...不过最后一张图实在过于复杂，包括CTPN的效果也都是非常一般。利用百度识别SDK也测试了下，结果也是差不多。 ?

2.6K7 0

OCR光学字符识别方法汇总

目前已经有很多文字检测方法，包括：EAST/CTPN/SegLink/PixelLink/TextBoxes/TextBoxes++/TextSnake/MSR/......，具体来说： 2.1.1 CTPN [1] CTPN是ECCV 2016提出的一种文字检测算法，由Faster RCNN改进而来，结合了CNN与LSTM深度网络，其支持任意尺寸的图像输入，并能够直接在卷积层中定位文本行...CTPN由检测小尺度文本框、循环连接文本框、文本行边细化三个部分组成，具体实现流程为： 1、使用VGG16网络提取特征，得到conv5_3的特征图； 2、在所得特征图上使用3*3滑动窗口进行滑动，得到相应的特征向量...CTPN是基于Anchor的算法，在检测横向分布的文字时能得到较好的效果。此外，BLSTM的加入也进一步提高了其检测能力。

1.8K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

CTPN论文翻译——中文版

CTPN dockernvidia-docker 安装

深度解析文本检测网络CTPN

场景文本检测—CTPN算法介绍

深度学习CTPN算法的解读与tensorflow实现

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network

03.OCR学习路径之文本检测（中）CTPN算法简介

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)

【文本检测与识别-白皮书-3.1】第三节：算法模型 2

CV学习笔记（十六）：Windows环境复现ChineseOCR

【项目实践】中英文文字检测与识别项目（CTPN+CRNN+CTC Loss原理讲解）

crnn dockernvidia-docker 安装

利用docker部署深度学习模型的一个最佳实践

CTPN、TextBoxes、SegLink、RRPN、FTSN、DMPNet…你都掌握了吗？一文总结OCR必备经典模型（一）

深度学习应用篇-计算机视觉-OCR光学字符识别：OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景

【深度学习】光学字符识别（OCR）

干货 | OCR技术在携程业务中的应用

EAST 自然场景文本检测实践(EAST: An Efficient and Accurate Scene Text Detector)

OCR光学字符识别方法汇总

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐