腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(755)
视频
沙龙
2
回答
PDF
和文本层
pdf
、
ocr
、
scanning
根据这个站点的,当添加一个文本层时,
PDF
是可搜索的。如果
扫描
仪在图像上执行
OCR
,它是否将文本存储在“文本层”中?或者是&qu
浏览 2
提问于2012-07-10
得票数 15
回答已采纳
3
回答
使用R在
PDF
中存储Tesseract输出
r
、
pdf
、
ocr
、
tesseract
我正在尝试使用R接口来测试tesseract来创建一个包含嵌入式文本的
PDF
文件。我已经看到了前面的问题,但是它是关于使用命令行接口进行tesseract的。这个问题是关于R界面的。我将tessedit_create_
pdf
选项设置为1,但没有得到新的
pdf
文件。我没有看到设置输出文件的选项。如何使tesseract创建一个带有嵌入式文本的
pdf
?下面的代码在内存中生成很好的文本,但是没有
PDF
文件。tesseract(language = "eng", options =
浏览 9
提问于2021-08-29
得票数 1
3
回答
将
扫描
的
PDF
转换为可搜索的
PDF
( R)
r
、
pdf
、
tesseract
、
pdftools
、
ropensci
我正在尝试使用tesseract和pdftools包将一系列
扫描
的
PDF
转换成可搜索的
PDF
。我已经完成了两步。现在我需要写回一个可搜索的
pdf
。读取
扫描
PDF
eg <- download.file("https://www.fujitsu.com/global/Images/sv600_c_automatic.
pdf</em
浏览 22
提问于2021-09-01
得票数 1
3
回答
如何区分数字创建的
PDF
和可搜索的
PDF
?
python
、
pdf
我想知道有多少
PDF
文件属于这三个类别: 这是很容易识别图像仅
PDF
在我的领域,
浏览 11
提问于2020-08-19
得票数 11
回答已采纳
2
回答
为什么我用魔杖从
pdf
中提取图像jpg,它会在文本上变成黑色背景?
python
、
ocr
、
rgb
、
cmyk
、
wand
我对一些
pdf
文件有问题。我需要将它们转换为jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在
word
转换为
pdf
文件的文件中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?原页
pdf
? 已将
pdf
转换为jpg
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
3
回答
如何在没有microsoft.office.interop的情况下将
PDF
转换为文档?
c#
、
pdf-generation
、
ms-office
、
openoffice.org
、
doc
我需要转换成.doc文件使用C#的
PDF
文件。虽然这台计算机没有安装Office,但它没有文件系统。有没有什么好办法让我这么做呢?我做了一些研究,大多数人都在使用互操作服务。
浏览 2
提问于2011-04-23
得票数 0
回答已采纳
1
回答
使用python从
PDF
中提取
扫描
页面
python
、
pdf
我有很多
PDF
文件,基本上是
扫描
文档,所以每一页都是一个
扫描
图像。我想要执行
OCR
并从这些文件中提取文本。我尝试过pytesseract,但它不直接对
pdf
文件执行
OCR
,因此,作为一项工作,我希望从
PDF
文件中提取images,将它们保存在目录中,然后直接在这些图像上使用pytesseract执行
OCR
。在python中有没有从
pdf
文件中提取
扫描
图像的方法?或者有任何方法可以直接对
pdf
文件执行
浏览 1
提问于2018-05-26
得票数 0
回答已采纳
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件进行批处理,更多
pdf
、
applescript
、
ocr
、
acrobat
、
automator
我使用ScanSnap S1500M将所有纸质文档
扫描
到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 删除
PDF
原始文件中的/
PDF
-<em
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
如何将所有图像转换为
Word
文档中的文本?
webapp-rec
、
ocr
这些图片中有文字,我找不到一个工具,可以很容易地做到这一点,最好没有任何安装。
浏览 0
提问于2011-02-17
得票数 0
1
回答
供私人使用的文件管理
document-management
、
dms
这些要求相对简单: 我已经试过我的mac了,但它还没修好.
浏览 4
提问于2013-08-08
得票数 5
1
回答
将
扫描
的
pdf
文件转换为文本可搜索的
pdf
文件
php
、
pdf
、
ocr
我想将
扫描
的
pdf
文件转换为可文本搜索的
pdf
文件。我想给出一个输入作为
扫描
的
PDF
,然后我的预期输出是可搜索的
PDF
。有几个工具,给我们的文本作为输出从
扫描
的
pdf
文件,但我想文本可搜索的
pdf
文件作为输出,而不仅仅是文本。请帮助我给任何开放源代码的网络api或付费网络api服务的链接,或任何工具,可以转换为文本搜索的
pdf
文件。 我在我的web应用程序中使用PHP语言。
浏览 25
提问于2017-07-09
得票数 1
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
pdf
、
search
、
text
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从
扫描
页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
4
回答
以最快的方式批量/批量地将
PDF
转换成可搜索的文本?(千)
windows
、
ocr
、
batch
、
file-conversion
我想知道是否有人有任何软件建议,以大规模
OCR
大约1000个
PDF
文件。可以;转换为文本、
word
文档或使
PDF
可搜索。我只需要一种高效的方法来分析转换后的文件。编辑:我基本上是在寻找一种方法,将5000~
扫描
的
PDF
转换为可搜索的
PDF
,甚至是文本文件。
浏览 0
提问于2019-05-06
得票数 0
1
回答
AttributeError:模块“ocrmypdf”没有属性“
ocr
”
python
、
ocr
、
python-tesseract
我正在使用ocrmypdf库将
扫描
的
pdf
转换成可搜索的
pdf
,但我得到了这个错误。这是我目前正在运行的代码ocrmypdf.
ocr
('/content/drive/MyDrive/Dataset 2020/
OCR
/1081975.
pdf
', 'output.
pdf
')AttributeError: module '
浏览 5
提问于2020-11-24
得票数 1
回答已采纳
2
回答
如何以编程方式验证
PDF
文件是否为第一代文件?
pdf
、
verification
要求嵌入的评估
PDF
文件是第一代。我找到了一种产品,可以让人检查
PDF
是否包含文本、图像,或者两者都包含:,但出于预算和其他原因,我正在寻找一种自己编程的方法。
浏览 0
提问于2011-07-27
得票数 1
回答已采纳
2
回答
如何区分
扫描
的
PDF
和常规的文本
PDF
r
、
pdf
、
tesseract
我正在处理多个
PDF
文件的
OCR
任务。其中一些是
扫描
的(不可搜索的),另一些只是原生的(可搜索的)
PDF
。image1 = image_read_
pdf
(file.list1[1], density=150)用于文本的
pdf
text1 =
pdf</em
浏览 7
提问于2021-04-10
得票数 1
1
回答
Google Drive API
扫描
文档
android
、
google-drive-api
我需要包含将文档
扫描
到我的应用程序中的功能。可以使用新的Google drive API来
扫描
文档吗?我尝试使用OpenCV来处理图像,但是没有得到好的结果。
浏览 1
提问于2014-07-17
得票数 2
1
回答
检查是否已从
Word
/Google Docs导出
PDF
pdf
、
ms-word
、
ocr
、
export-to-pdf
我正在做一些OCRing
PDF
的工作,我很好奇是否有一种方法可以检查一个
PDF
是否已经从
Word
(或Google Docs)导出。我可以检查
PDF
是否已经用Xpdf的pdffonts进行了
OCR
。我知道
Word
和Google Docs会自动
OCR
导出的
PDF
,所以如果我发现
PDF
没有
OCR
,我就知道它没有导出。但是,如果它已经光学字符识别,有没有办法检查的
PDF
是否从
Word
&
浏览 2
提问于2013-06-14
得票数 0
1
回答
扫描
pdf
至doc
pdf
有没有人知道是否有一个免费的在线
OCR
转换器,可以转换大
扫描
的
pdf
文件(例如,我想转换一个
扫描
的28 of大小的
pdf
文档)? 我试过很多
ocr
转换器,但都失败了。
浏览 0
提问于2016-01-17
得票数 0
点击加载更多
相关
资讯
扫描版PDF怎么转换成Word?pdf转word在线转换免费方法分享
pdf转word,教你pdf转word的方法
pdf转word在线,分享pdf转word的方法
pdf转word,这些pdf转word方法值得收藏
Word转PDF怎么转-Word转PDF适合新手的方法
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券