腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
带有
OCR
松散
OCR
的ps2
pdf
我已经寻找了大量的时间来
转换
ps2
pdf
与
OCR
。所发生的事失去了
OCR
。
pdf
2ps test.
pdf
浏览 1
提问于2020-05-26
得票数 1
回答已采纳
2
回答
如何将
pdf
格式
转换
为eBook格式
、
是否有方法将
PDF
文档
转换
为eBook格式,如epub、azw或mobi?我正在寻找一个应用程序,这是快速的
转换
。我刚试过口径。10分钟后,甚至没有达到2%的
转换
。所以请不要有口径。CLI是首选。
浏览 0
提问于2013-04-26
得票数 9
回答已采纳
1
回答
如何将jpg文件目录
转换
为以文件名为书签的
pdf
?
、
、
如何将它们
转换
为一个将文件名作为书签的
pdf
文件? (我最终也想加入
ocr
。如前所述,我们可以使用.jpg将.
pdf
文件
转换
为img2
pdf
.jp --output combined.
pdf
,然后可以使用ocrmypdf combined.
pdf
combined_
ocr
.
pdf
添加
ocr
。我的问题主要是如何确保
pdf
文件有书签(由文件名创建),以便文档易于浏览。
浏览 0
提问于2021-09-23
得票数 0
1
回答
AttributeError:模块“ocrmypdf”没有属性“
ocr
”
、
、
我正在使用ocrmypdf库将扫描的
pdf
转换
成可搜索的
pdf
,但我得到了这个错误。这是我目前正在运行的代码ocrmypdf.
ocr
('/content/drive/MyDrive/Dataset 2020/
OCR
/1081975.
pdf
', 'output.
pdf
')AttributeError: module '
浏览 5
提问于2020-11-24
得票数 1
回答已采纳
1
回答
使用Python PyPDF2从扫描的
pdf
(图像)中提取文本
、
、
、
我一直在尝试从扫描的
PDF
中提取文本(具有不可选文本的图像)。我想要的信息,包含日期,发票编号从
pdf
链接()。from PIL import Imagepage =
pdf
_reader.getPage
浏览 2
提问于2020-05-27
得票数 1
回答已采纳
1
回答
从
PDF
中获取树的文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个
PDF
()中的树。文件的名称将是左边对应的树号(t0、t1等)。在这两种方法中的任何
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
将扫描的
pdf
转换
为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。即使它的格式仍然很好,我也不知道如何将字符对象
转换
成最终的df。 有没有一种方法可以将扫描的
pdf
转换
成可读的
pdf
,这样我就可以在tabulizer中抓取它了?
浏览 5
提问于2022-11-16
得票数 0
1
回答
扫描
pdf
至doc
有没有人知道是否有一个免费的在线
OCR
转换
器,可以
转换
大扫描的
pdf
文件(例如,我想
转换
一个扫描的28 of大小的
pdf
文档)? 我试过很多
ocr
转换
器,但都失败了。
浏览 0
提问于2016-01-17
得票数 0
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换
为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换
成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传文件到另一个网站或下载的文件,以进行
转换
。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换
。那么,是否有可能使用气体进行覆盖呢?我只看到人们
转换
成文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
1
回答
两种输入文件类型同时在GNU并行?
、
、
、
-l deu_frak && rm {.}.pgm' b) export -f generate_pgm PGM="$1"
浏览 2
提问于2017-07-25
得票数 1
1
回答
将扫描的
pdf
文件
转换
为文本可搜索的
pdf
文件
、
、
我想将扫描的
pdf
文件
转换
为可文本搜索的
pdf
文件。我想给出一个输入作为扫描的
PDF
,然后我的预期输出是可搜索的
PDF
。有几个工具,给我们的文本作为输出从扫描的
pdf
文件,但我想文本可搜索的
pdf
文件作为输出,而不仅仅是文本。请帮助我给任何开放源代码的网络api或付费网络api服务的链接,或任何工具,可以
转换
为文本搜索的
pdf
文件。 我在我的web应用程序中使用PHP语言。
浏览 25
提问于2017-07-09
得票数 1
1
回答
高新ECM含量
转换
我使用Alfresco将TIFF
转换
为
PDF
,使用Tiger
OCR
库()<?BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'> <bean id="transformer.
Ocr
.Ti
浏览 1
提问于2011-04-15
得票数 0
1
回答
Python
OCR
Sudoku图像
、
我需要使用
ocr
来
转换
sudoku图像上的数字,并将其作为网格读取。
浏览 3
提问于2022-06-16
得票数 0
1
回答
关于一个好的自由软件/网站将
pdf
转换
为EPUB的建议
、
我发现,当我将一个包含大量文本的
pdf
文件
转换
成EPUB格式(例如书籍)时,它们会在同一句话之间被分割成段落,我使用过-量程,Toepub.com和许多在大坏网站上可以找到的网站;-)。我还没有能够完全掌握口径的不同的features.So,任何黑客修复在口径内的
转换
也是非常感谢的。 我的基本问题是文字被歪曲了。
浏览 0
提问于2019-11-14
得票数 0
1
回答
如何像Chrome浏览器那样使用Python从
PDF
中提取文本?
、
、
我正在尝试从
pdf
文件中提取文本(类似于表单)。目前,我在Chrome上打开文件,选择/复制所有文本,将其粘贴到txt文件中,然后使用Python将其处理为CSV。Chrome让我的数据非常结构化和统一,这样
pdf
的每一页都会产生类似的文本块,让我可以轻松地处理它。我试图直接从
pdf
中提取文本,以将其处理为CSV格式,但由于原始
pdf
的生成方式,我总是得到一些混乱的结果。我尝试过pdfminer和pyPdf2,但当表单在某些字段中缺少值时,结果会变得混乱。
浏览 35
提问于2021-06-16
得票数 0
4
回答
一种基于
OCR
的
PDF
文本提取方法
、
、
是否有人尝试过使用
OCR
库和Java从
PDF
中提取文本?你认为什么是最可靠的文本提取库?我见过的大多数方法(tesseract、GOCR)都是C库,需要编写一些JNI代码。
浏览 2
提问于2009-04-22
得票数 6
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 我应该用自动售货
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
从可搜索的
pdf
中读取,不带
ocr
我目前正在使用扫描仪将我的
PDF
转换
为可搜索的
PDF
。
OCR
已经处理好了,因为我可以在
PDF
中使用ctrl-f。 但是,我如何才能从我的程序中获取
OCR
的内容。是否可以通过读取文件来公开访问
OCR
文本?
浏览 1
提问于2011-12-15
得票数 0
3
回答
有没有办法制作一个无法
转换
成word的
pdf
?
、
、
、
我们有一个生成
PDF
文件的系统。但是任何人都可以使用在线
pdf
to word
转换
器来
转换
这些文件。在Yii或PHP中有什么选项可以阻止这种情况吗?
浏览 0
提问于2016-03-07
得票数 0
1
回答
对Tesseract的最佳分辨率-
OCR
、
、
、
什么是最好的tif图像分辨率的
OCR
?我刚刚
转换
了一个
OCR
-
PDF
使用幽灵脚本,决议1200给出更好的
转换
为文本。
浏览 4
提问于2013-09-01
得票数 0
回答已采纳
点击加载更多
相关
资讯
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
通用 PDF OCR 到 Word API 数据接口
epub转换pdf在线转换,用什么工具将epub转换pdf
ppt转换pdf怎么转换?
图片转换PDF怎么转换?
热门
标签
更多标签
云服务器
ICP备案
云点播
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券