腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用doc取器在
PDF
文件中搜索
文本
?
、
、
我试图在
PDF
文件中找到一些
文本
,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有
文本
,而其他
PDF
是
文本
和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
如何使用Firebase ML工具包
识别
PDF
文件中的
文本
?
、
、
我正在开发一个Android应用程序来检测
PDF
文件中的
文本
。 我试着测试更多的文件格式:
浏览 1
提问于2019-03-07
得票数 0
1
回答
使用c#
识别
从
pdf
文档中提取的
文本
的段落和页面边界
我正在开发应用程序,我需要从
pdf
中
识别
段落。是否有任何方法提取
文本
和
识别
段落和页面边界提取的
文本
从
pdf
文档使用c#?
浏览 2
提问于2015-03-25
得票数 3
回答已采纳
1
回答
VNDocumentCameraScan到可搜索
PDF
、
、
、
documentCameraViewController(_ controller: VNDocumentCameraViewController, didFinishWith scan: VNDocumentCameraScan) { }} 我还知道如何从VNDocumentCameraScan中提取
文本
。我错过的是如何将
文本
信息合并到PDFDocument实例中。我需要这样做,因为我想扫描文档,将它们作为.
pdf
保存到
浏览 4
提问于2020-09-09
得票数 3
回答已采纳
1
回答
如何在将文档从
PDF
转换为
文本
时处理unicode字符编码问题
、
、
、
、
我正在尝试从
PDF
中提取
文本
。
PDF
包含印地语(Unicode)
文本
。我使用的提取实用程序是Apache PDFBox ( )。提取器提取
文本
,但
文本
无法
识别
。我尝试了在多种编码和字体之间切换,但仍然无法
识别
预期的
文本
。下面是一个例子:假设
PDF
中的
文本
是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
1
回答
Acrobat OCR
识别
的访问
文本
、
、
我有
PDF
文件已经被“
识别
”使用OCR
文本
识别
->
识别
文本
使用功能在Acrobat。有什么想法吗?
浏览 0
提问于2010-06-25
得票数 0
回答已采纳
1
回答
免费Windows OCR软件
、
、
我有一些
PDF
,其中包含扫描打印-作为图像。有些是有插图或没有插图的书,有些是带有混合文字和图形的漫画(所有这些都没有版权)。是否有一些免费的Windows OCR软件,可以提取
文本
,最好保留字体大小,以便我能够区分章节等等?
浏览 0
提问于2020-05-19
得票数 0
回答已采纳
1
回答
是否可以从可搜索的
PDF
访问
文本
覆盖?
、
我知道
PDF
和
文本
可搜索的
PDF
是有区别的。
文本
可搜索
PDF
具有用于搜索的
文本
覆盖。是否可以将此
文本
覆盖提取到txt文件中?也许可以使用Adobe API?
浏览 4
提问于2012-10-05
得票数 8
回答已采纳
1
回答
我需要关于在网络上显示(和/或转换)
pdf
文件的建议
、
、
、
目前我们只支持Word文档( .doc或.docx)和纯
文本
。我们使用JODConverter库在Word和html之间进行转换;html是存储在数据库中的内容和显示给用户的内容。我们也想接受
PDF
,但我不确定显示
PDF
或将其转换为html的最佳方式是什么。或者,我们可以忘记直接显示
PDF
文件,而是像处理Word文档那样将它们转换为html,但我还没有遇到一个好看的库来实现这一点。最后一件事,我们计划为付费客户提供下载原始
PDF
文件的选项。这可能会很复杂吗?在构建流程的其余部分时,有什么是我应该牢记的吗?
浏览 2
提问于2012-03-24
得票数 3
4
回答
哪些工具可以在Mac上将扫描过的纸张文件转换成可搜索的
文本
pdf
?
、
、
、
、
我需要将扫描文档转换为mac上可搜索的
文本
PDF
。 Acrobat可以通过其
文本
识别
功能完美地完成这一任务,但考虑到我只需要这一个功能,Acrobat是相当昂贵的。有没有其他OCR工具可以做到这一点?
浏览 0
提问于2015-03-02
得票数 2
回答已采纳
2
回答
如何将
pdf
文档转换为xml,并获取包含表数据的部分。
、
、
、
有一个
pdf
文档,我想把它转换成xml或html。我想得到表数据来存储数据库。
浏览 2
提问于2015-07-27
得票数 0
回答已采纳
2
回答
文本
提取库不返回非空页的
文本
。
、
我编写了一个从
PDF
文档中提取
文本
的程序。但一份
PDF
文件给了我空的短信。我可以在Acrobat中打开
PDF
文件,它可以正常工作。我的代码可以很好地处理其他
PDF
文件,所以我想知道是什么导致了这个问题。我用了PyPDF2和PyPDF2,但结果是一样的。所以这个文件一定有问题: from PyPDF2 import PdfReader for page in reader.pages
浏览 12
提问于2022-06-27
得票数 0
3
回答
从二进制数据
识别
不带扩展名的文件类型
、
、
、
我的疑问是,我如何才能在没有扩展的情况下
识别
其类型,而不使用第三方工具。我的服务器是cent。
浏览 0
提问于2012-08-30
得票数 3
回答已采纳
1
回答
我们应该使用什么python库来从
PDF
中提取包含复杂标题的表?
、
、
、
、
我尝试使用很多库来从
PDF
中提取表格,比如: camelot,tabula,PDFPlumber,PDFTabExtract…但是他们不会给出一个好的结果。使用camelot,我不能有一个适用于我
PDF
中所有页面的脚本。使用Tabula时,当表格有一个旋转的
文本
标题时,我得到了一个令人困惑的数据帧。使用PDFPlumber时,我遇到了流表的问题(它只适用于晶格表),而使用PDFTabExtract时,当
文本
被旋转时,它会忽略它。 有没有什么办法可以让我在
pdf
中转换任何不同格式的表格?
浏览 13
提问于2019-06-10
得票数 0
1
回答
如何使用python
识别
pdf
中的图形?
、
、
、
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
是否有任何不基于OCR的通用布局分析库或工具?
、
我正在寻找布局分析库或工具(最好是开源的),可以应用于
文本
PDF
,以
识别
主要
文本
内容与侧栏,章节标题,章节标题(甚至可能是具有装饰/阴影和下划线的花哨的标题)等。我遇到了像OCRopus这样的工具,它们使用光学字符
识别
和图像
识别
来
识别
布局。有没有库可以在没有OCR的情况下做同样的事情?可以从
文本
PDF
中提取
文本
和图像,并将包含
文本
和图像位置的输入提供给该工具;对于此类文件使用OCR将是相当
浏览 2
提问于2013-05-08
得票数 2
回答已采纳
1
回答
从可搜索的
pdf
中读取,不带ocr
我目前正在使用扫描仪将我的
PDF
转换为可搜索的
PDF
。OCR已经处理好了,因为我可以在
PDF
中使用ctrl-f。 但是,我如何才能从我的程序中获取OCR的内容。是否可以通过读取文件来公开访问OCR
文本
?
浏览 1
提问于2011-12-15
得票数 0
1
回答
用pyPdf
识别
PDF
中的粗体
文本
、
我使用pyPdf从
PDF
中提取
文本
。我希望能够知道哪个
文本
是粗体,以便
识别
粗体部分标题。如何
识别
粗体
文本
?
浏览 3
提问于2014-09-04
得票数 7
2
回答
使用Google Cloud Vision的OCR
PDF
文件?
、
、
、
目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的
PDF
文件的后端?如果没有,如何使用Google Cloud Vision将
PDF
转换为OCRed
PDF
?据我所知,Cloud Vision目前支持
PDF
文件,但它只能将
识别
的
文本
输出为JSON文件。因此,似乎需要在Google Cloud Vision之外的另一个步骤中,将这个转换后的
文本
放在
PDF
中的图像顶部。我经常需要将扫描的文档转换为包含OC
浏览 0
提问于2018-09-15
得票数 4
3
回答
操作
PDF
文件,Windows Forms C#
、
、
、
我有
pdf
页面,我想打印/保存从C#的windows窗体应用程序,但是我想修改文件之前,在添加一个用户编写的最终评论页面(只有
文本
)。 谁能给我指出一个简单的
pdf
库,它用简单的代码做这件事。
浏览 2
提问于2010-11-08
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDF文件如何迅速转成TXT文本?
如何给Pdf文本添加图形标注
白话文本识别经典模型:CRNN
如何为PDF文件添加文本框?PDF编辑小妙招!
福昕PDF编辑器设置PDF文本删除线教程
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券