腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(2886)
视频
沙龙
1
回答
检查是否已从
Word
/Google Docs导出
PDF
pdf
、
ms-word
、
ocr
、
export-to-pdf
我正在做一些OCRing
PDF
的工作,我很好奇是否有一种方法可以检查一个
PDF
是否已经从
Word
(或Google Docs)导出。我可以检查
PDF
是否已经用Xpdf的pdffonts进行了
OCR
。我知道
Word
和Google Docs会自动
OCR
导出的
PDF
,所以如果我发现
PDF
没有
OCR
,我就知道它没有导出。但是,如果它已经光学字符
识别
,有没有办法检查的
PDF
是否从
W
浏览 2
提问于2013-06-14
得票数 0
4
回答
哪些工具可以在Mac上将扫描过的纸张文件转换成可搜索的文本
pdf
?
osx
、
pdf
、
ocr
、
text-search
、
scanning
我需要将扫描文档转换为mac上可搜索的文本
PDF
。它不需要免费,只需要比Acrobat更低的成本。
浏览 0
提问于2015-03-02
得票数 2
回答已采纳
1
回答
用c#编程编辑
PDF
(非固定
PDF
)
c#
、
pdf
、
pdf-generation
、
itextsharp
、
acrofields
是否可以编辑在C#中不可填充的
PDF
格式 所需经费: 必须编辑以编程方式填写的表格中的文本和数据,并保存它。
浏览 6
提问于2012-06-28
得票数 1
2
回答
为什么我用魔杖从
pdf
中提取图像jpg,它会在文本上变成黑色背景?
python
、
ocr
、
rgb
、
cmyk
、
wand
我对一些
pdf
文件有问题。我需要将它们转换为jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在
word
转换为
pdf
文件的文件中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?原页
pdf
? 已将
pdf
转换为jpg
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
4
回答
一种基于
OCR
的
PDF
文本提取方法
java
、
pdf
、
text-parsing
是否有人尝试过使用
OCR
库和
Java
从
PDF
中提取文本?你认为什么是最可靠的文本提取库?我见过的大多数方法(tesseract、GOCR)都是C库,需要编写一些JNI代码。
浏览 2
提问于2009-04-22
得票数 6
1
回答
上传
pdf
文件与gdata docs python v3.0与
ocr
python
、
pdf
、
ocr
、
gdata
、
gdata-api
我已经获得了以下用于将
pdf
文件上传到google docs的实现(取自gdata API示例): """Upload a document,doc = gdata.docs.data.Resource(type='document', title='My Sample Doc') print 'Created, a
浏览 0
提问于2011-12-31
得票数 2
回答已采纳
2
回答
如何从
pdf
图像中查找文本?
c#
、
asp.net
、
ocr
我正在开发一个C#应用程序,我在其中将
PDF
文档转换为图像,然后在自定义查看器中呈现该图像。 当我试图在生成的图像中搜索特定的单词时,我遇到了一些困难,我想知道最好的方法是什么。
浏览 2
提问于2012-09-25
得票数 4
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
java
、
php
、
macos
我试图从命令行运行一个
java
jar文件,在执行过程中它会给出一个路径。在这条路径上,他们是空格,这是导致问题的原因。即$f = `
java
-jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;
java
-jar /
OCR</em
浏览 1
提问于2010-04-15
得票数 0
3
回答
将扫描的
PDF
转换为可搜索的
PDF
( R)
r
、
pdf
、
tesseract
、
pdftools
、
ropensci
我正在尝试使用tesseract和pdftools包将一系列扫描的
PDF
转换成可搜索的
PDF
。我已经完成了两步。现在我需要写回一个可搜索的
pdf
。读取扫描
PDF
eg <- download.file("https://www.fujitsu.com/global/Images/sv600_c_automatic.
pdf
", "exa
浏览 22
提问于2021-09-01
得票数 1
1
回答
供私人使用的文件管理
document-management
、
dms
这些要求相对简单:
浏览 4
提问于2013-08-08
得票数 5
2
回答
图像-文本转换器
gratis
、
images
、
math
、
ocr
我想要一种方法,把书中的部分图像转换成一个包含数学方程的
Word
文档。现在,如果没有开发这样一个软件来处理
Word
中的数学方程,那么它至少应该将数学方程作为图片嵌入到
Word
文档中。
浏览 0
提问于2015-08-14
得票数 2
1
回答
如何使用doc取器在
PDF
文件中搜索文本?
pdf
、
search
、
text
我试图在
PDF
文件中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件?
PDF
文件之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.:这两个
PDF
文件位于同一个目录中。
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
3
回答
如何在没有microsoft.office.interop的情况下将
PDF
转换为文档?
c#
、
pdf-generation
、
ms-office
、
openoffice.org
、
doc
我需要转换成.doc文件使用C#的
PDF
文件。虽然这台计算机没有安装Office,但它没有文件系统。有没有什么好办法让我这么做呢?我做了一些研究,大多数人都在使用互操作服务。
浏览 2
提问于2011-04-23
得票数 0
回答已采纳
1
回答
如何从
PDF
中提取音乐符号?
pdf
、
extract
、
ghostscript
、
music-notation
我试图用另一种内置字体渲染
PDF
格式的音乐符号,但我不知道怎么做。gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_
pdf
.txt Betlem.
pdf
iconv.exe -f MAC
浏览 5
提问于2019-07-22
得票数 0
回答已采纳
3
回答
PDF
转
Word
?
文字识别
浏览 483
提问于2018-06-03
3
回答
OCR
图形纸
ocr
我想把一个扫描过的图形纸笔记本(有手写)的
pdf
格式转换成一个文本文件。谢谢
浏览 6
提问于2009-06-20
得票数 1
2
回答
如何在R中逐行读取
PDF
?
r
、
pdf
、
text-mining
我使用pdftools包中的read_
pdf
()函数逐行读取
PDF
文件,但突然之间,它没有改变脚本、任何参数或行中的任何内容,而是开始读取整个页面,而不是逐行分隔元素。我怎样才能让它回到逐行分离?
浏览 8
提问于2022-09-30
得票数 0
回答已采纳
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
pdf
、
google-apps-script
、
ocr
、
drive
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传文件到另一个网站或下载的文件,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档文件。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
1
回答
不安装Tesseract的Apache Tika
OCR
java
、
ocr
、
tesseract
、
apache-tika
我正在使用将
PDF
文件解析为文本。一些
PDF
文件可以包含扫描文档。Apache使用Tesseract将文本
识别
为图像。(AbstractPDF2XHTML.
java
:428) at org.apache.pdfbox.text.
浏览 5
提问于2017-09-16
得票数 6
2
回答
Tesseract
OCR
混淆了0到8的斜线
python
、
ocr
、
tesseract
我曾在终端字体上训练过tesseract,但无论如何,我都无法让它
识别
出0。我正在使用jTessEditor创建培训tif和框。即使在验证时,它也会将所有的0读为8s。我遗漏了什么吗?
浏览 8
提问于2018-10-31
得票数 22
点击加载更多
相关
资讯
pdf转word,教你pdf转word的方法
pdf转word在线,分享pdf转word的方法
pdf转word,这些pdf转word方法值得收藏
Word转PDF怎么转-Word转PDF适合新手的方法
手机pdf转word,教你快速将pdf转word
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券