腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用Python PyPDF2从扫描
的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描
的
PDF
中提取文本(具有不可选文本
的
图像)。我想要
的
信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
用模糊文本改进Tesseract
OCR
结果
、
、
、
我正在致力于印刷文本
的
OCR
识别。特别是,我着重于预处理步骤,以改进引擎
的
结果。通过自适应阈值处理、噪声去除、文本分割等,取得了良好
的
效果。但是,当其他商业产品获得不错
的
结果时,Tesseract似乎还是失败了。 For furth
浏览 3
提问于2014-12-27
得票数 16
8
回答
OCR
文字
识别技术有哪些应用?
OCR
是实时高效
的
定位与识别图
片中
的
所有
文字
信息,返回
文字
框位置与
文字
内容。支持多场景、任意版面下整图
文字
的
识别,以及中英文、字母、数字
的
识别。简单来说就是将图片上
的
文字
内容,智能识别成为可编辑
的
文本,这么强大
的
功能在我们生活当中有哪些应用呢?
浏览 3646
提问于2018-08-24
2
回答
如何用谷歌翻译图片上
的
文字
?
我不确定这是否是SE提出这个问题
的
正确部分,但它是这样
的
。
浏览 18
提问于2014-08-06
得票数 0
回答已采纳
1
回答
如何在Laravel中统计波斯语
pdf
?
、
、
、
、
我
的
项目是关于
的
。我
的
网站是基于翻译文件和书籍等。客户上传他
的
源文件为
pdf
,在后端,字数
的
pdf
应该由一个
OCR
来确定最终
的
价格,所以单词
的
计数是非常重要
的
。主要
的
问题是
OCR
的
波斯
文字
有问题。
浏览 0
提问于2019-12-03
得票数 0
回答已采纳
1
回答
腾讯云
文字
识别和腾讯优图
文字
识别?
请问腾讯云官网
的
文字
识别和腾讯优
图
网站上
的
OCR
文字
识别有什么区别啊,这两个接口调用
的
好像不一样?
浏览 654
提问于2020-03-30
2
回答
亚马逊公司对亚马逊推理公司
的
DetectText
、
、
如何决定何时使用Amazon
的
TextDetect方法? 我
的
用法是单击移动中
的
图片,将图像数据转换为文本,并将其存储为AWS RDS。
浏览 4
提问于2019-05-06
得票数 12
回答已采纳
1
回答
从
PDF
中获取树
的
文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个
PDF
()中
的
树。文件
的
名称将是左边对应
的
树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。具体来说,当我尝试将树提取为图像(使用)时,没有出现任何树(大概是因为树不是正确
的
格式)。然而,当我尝试将其全部提取为文本(如)时,树会丢失它们
的
所有格式(以及它们
的
一些信息,我认为)。我怎样才能从这个
PDF
中获取我想要
的
文件呢?能用Python完成吗?还有更简单
的</e
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
印刷在金属板上
的
文字
上
的
OCR
、
、
、
、
我正在从事一个
OCR
项目,其目标是读取金属板上印有邮票
的
序列号:我使用OpenCV为
OCR
准备图像,并为
OCR
本身使用Tesseract。这是一个理想
的
过程: 然而,我
的</em
浏览 3
提问于2015-06-17
得票数 8
3
回答
手写表单,怎么定位识别区域。每张图片像素大小都不确定?
如何识别表单中
的
特定区域手写汉字。
浏览 743
提问于2018-04-17
2
回答
可将
OCR
文本插入回源
PDF
的
OCR
库
、
是否有库(或可执行文件)可以
OCR
PDF
(通常是通过扫描纸张创建
的
PDF
),并将识别出
的
文本重新注入到
PDF
中?很可能是扫描图像背后
的
隐形
文字
。 最好是开源
的
。(目标:我有一个巨大
的
由Lucene索引
的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关
的
。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
用于文本检测
的
开源Python工具
、
、
、
、
有没有开源项目可以用来检测图
片中
是否有
文字
?它不需要做
OCR
,只要告诉我们图像上是否有文本
的
可能性就行了。如果我找不到现成
的
,我
的
想法是建立一个CNN模型来完成这项工作,但我假设已经这样做了。
浏览 2
提问于2016-03-15
得票数 1
2
回答
LibreOffice中
的
光学字符识别
还有更多
的
页面包含有3列
的
表(当前
的
编号、名称和级别)。我使用LibreOffice和Ubuntu12.04。
浏览 0
提问于2013-07-03
得票数 3
2
回答
如何修复在Apache Tika for Python中解析
的
中文
PDF
以正确读取字符?
、
、
、
我有一个下载
的
PDF
在中国,我想提取文本从使用提卡+ Python (原始链接到完整
的
PDF
可以找到,或提取
的
样本页面可以找到)。·Æ ɪ £¬ £Ì £® £È £® 我创建了一个使用拉丁字符
的
PDF
,并使用完全相同
的
脚本对其进行了解析,它在命令行中打印得非常好。如果它不识别字体(),它也会出现:然而,在
浏览 1
提问于2020-09-07
得票数 0
1
回答
请问有图片鉴黄和
文字
甄别功能吗?现
文字
违规监控那么严格,有什么好
的
检测吗?
、
浏览 527
提问于2020-01-12
回答已采纳
1
回答
如何判断
pdf
文件中隐藏
的
文本层是否来自
OCR
?
我见过一些
pdf
文件后,
OCR
有非常准确
的
文本(无论是在识别率,在文本对齐图像)。 如果
pdf
文件中隐藏
的
文本层是否来自
OCR
,那么Unix/Linux工具会帮助我知道什么呢?
浏览 0
提问于2014-12-07
得票数 2
1
回答
我如何从谷歌图书
的
全景式图书中获得所有纯文本?
、
还有一个选项可以看到一定数量
的
纯文本:当你看到一本旧书
的
页面图像时,如果你点击右上角
的
齿轮图标,然后点击下拉菜单中
的
“纯文本”,你就可以看到几页
的
OCR
纯文本。但我想得到所有页面的纯文本。显然,我可以反复复制和粘贴,但如果这本书是长
的
,那么这个过程将需要许多小时,可能是几天。编辑:尽管Google称它为“纯文本”,但它包含原始文本中
的
斜体。不幸
的
是,无法通过下载
PDF
并使用Sele
浏览 0
提问于2017-11-06
得票数 4
1
回答
使用xsane作为没有扫描器
的
OCR
、
当我启动xsane时,它会以不可访问
的
消息退出。如何抑制设备搜索?
浏览 0
提问于2015-07-03
得票数 1
1
回答
关于拆分
PDF
和
OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过
的
文字
版本。我需要在
pdf
中拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。哪种编程语言和库给了我最大
的
灵活性来完成这样
的
任务,而不需要我做所有繁琐
的
工作。我对Python很熟悉。我知道Python
的
PDF
和
OCR
库,但我找不到任何关于拆分单个页面的内容。然后,最后希望将
pdf
页面的拆分部分传递给
OCR
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
优
图
OCR
识字总有空格怎么办?
、
接
的
优
图
OCR
接口,识别图中一段
文字
提取关键字,发现总在字之间出现空格?(有的原本没有空格)请问这种情况该怎么解决?
浏览 573
提问于2019-12-04
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用OCR软件怎样提取图片中的文字?
pdf页面怎么提取图片中的文字呢?
OCR技术助力,轻松从图片中提取文字,办公学习必备!
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
怎样提取图片中的文字?用什么软件提取图片中的文字比较准确?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券