腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
更新多个列,使其与另一列相等
、
其中一份
文件
是原件。我需要更新我的表,以使组Id等于原始文档。因此,如果所有文档属于同一组,则它们必须具有相同的统一标题。例如,
OCR
0000000006和
OCR
0000000008都有统一的标题06000146.
pdf
。94 06000847.
pdf
OCR
0000000004
OCR
0000000006 No 95 06000117.
pdf
OCR
00
浏览 0
提问于2014-03-22
得票数 0
1
回答
如何将
OCR
文本从一个
PDF
传输到另一个
PDF
?
、
、
我有一个相同扫描的
PDF
的两个版本。其中一个有
OCR
层。如何将该层转移到另一层?我已经安装了Ghostscript,但我不知道下一步该做什么。
浏览 0
提问于2020-04-06
得票数 0
1
回答
在终端中运行命令,并在输出中包含输入名
、
、
、
、
我在Dolphin服务菜单
文件
中有这一行,该
文件
包含用于
PDF
处理的许多其他命令:它的优点是提供表单MY_
PDF
_
ocr
.
pdf
的输出
文件
,从而保留输入
文件
的名称。为此,我可以用这句话: Exec=kon
浏览 0
提问于2022-11-30
得票数 0
回答已采纳
3
回答
更改windows批处理中的
文件
扩展名
、
、
、
我正在尝试重命名很多
文件
。到目前为止,我只想将扩展从".
pdf
.
OCR
.
pdf
“更改为".
pdf
”,我得到了以下代码但是它似乎不适用于有多个点的扩展--我做错了什么?
浏览 5
提问于2015-08-27
得票数 1
回答已采纳
2
回答
如何区分扫描的
PDF
和常规的文本
PDF
、
、
我正在处理多个
PDF
文件
的
OCR
任务。其中一些是扫描的(不可搜索的),另一些只是原生的(可搜索的)
PDF
。image1 = image_read_
pdf
(file.list1[1], density=150)用于文本的
pdf
text1 =
pdf</em
浏览 7
提问于2021-04-10
得票数 1
1
回答
将扫描的
pdf
转换为R中可搜索的
pdf
、
我有一个
pdf
,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。环顾在线,我所能得到的最远就是将扫描的
pdf
作为一个字符对象读取到R中,但这会使格式发生很大的变化,因此表中的列都错对齐了,并出现了无序。有没有一种方法可以将扫描的
pdf
转换成可读的
pdf
,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
1
回答
使用Google脚本从多页附件
PDF
中提取文本
、
、
、
、
我有一个Gmail附件
PDF
与多个扫描页面。当我使用Google脚本将blob从附件保存到驱动器
文件
时,从Google手动打开
PDF
,然后选择,
PDF
中的所有文本都显示为Google。但是,当我将blob保存为带有
OCR
的Google时,只有第一个页面上的图像中的文本被保存到Doc中,可以手动访问,也可以通过代码访问。let resources = { mimeType: "application/
pdf
"
浏览 8
提问于2020-07-02
得票数 0
回答已采纳
1
回答
两种输入
文件
类型同时在GNU并行?
、
、
、
-l deu_frak && rm {.}.pgm' b) 首先将所
浏览 2
提问于2017-07-25
得票数 1
1
回答
有没有办法区分原生和扫描的
pdf
?
我使用
ocr
技术从包含图像的
pdf
中提取文本,但我只想在
pdf
还
不能
搜索的情况下使用
ocr
,否则我想使用pdfminer或类似的库。 有没有办法区分已经可以搜索的
pdf
和
不能
搜索的
pdf
?
浏览 5
提问于2019-06-22
得票数 1
1
回答
Applescript或Automator:运行Acrobat对
OCR
多个
PDF
文件
进行批处理,更多
、
、
、
、
我使用ScanSnap S1500M将所有纸质文档扫描到/
PDF
-S1500M/-我想使用对文本进行
OCR
。我想(每天)自动化这个过程: 删除
PDF
原始
文件
中的
浏览 5
提问于2011-08-18
得票数 1
回答已采纳
1
回答
如何使用doc取器在
PDF
文件
中搜索文本?
、
、
我试图在
PDF
文件
中找到一些文本,但结果并不准确!举个例子,我有两个
PDF
文件
,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件
和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件
?
PDF
文件
之间有什么区别吗?在一个
PDF
中,我只有文本,而其他
PDF
是文本和图像,这是从扫描页面。陷阱是什么? P.S.
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
如果无法删除
文件
,请等待,然后再试一次。
中暂时不可用的资源 我只是不知道该怎么做。");和
浏览 2
提问于2018-11-13
得票数 0
回答已采纳
1
回答
使用python从
PDF
中提取扫描页面
、
我有很多
PDF
文件
,基本上是扫描文档,所以每一页都是一个扫描图像。我想要执行
OCR
并从这些
文件
中提取文本。我尝试过pytesseract,但它不直接对
pdf
文件
执行
OCR
,因此,作为一项工作,我希望从
PDF
文件
中提取images,将它们保存在目录中,然后直接在这些图像上使用pytesseract执行
OCR
。在python中有没有从
pdf
文件
中提取扫描图像的方法?或者有任何方法可以直
浏览 1
提问于2018-05-26
得票数 0
回答已采纳
1
回答
检测景观格式的图像,并将其分割成两幅肖像。
、
、
、
、
我已经扫描了
PDF
格式的
文件
。这些
文件
包含一页纵向格式和两页横向格式的页面。for i in *.
pdf
; # Créer le fichier
PDF
avec
OCR
ocrmyp
浏览 2
提问于2020-04-20
得票数 1
1
回答
在子
文件
夹中批处理
OCR
文件
,并以新名称保存新
文件
、
、
、
、
我有以下代码,
OCR
的所有
PDF
文件
都在一个特定的
文件
夹中(d:\exttmp2),但它没有按我的意愿重命名这些
文件
,也没有将新
文件
放在正确的位置。目前,所有
文件
都在‘exexttmp2’的子
文件
夹中。
OCR
运行正常,但我希望将
OCR
‘’ed
文件
重命名为:<parent folder path>-<filename>_ocred.
pdf
。它还将
文件
浏览 2
提问于2021-06-09
得票数 0
回答已采纳
1
回答
如何将jpg
文件
目录转换为以
文件
名为书签的
pdf
?
、
、
我有一个目录的jpg
文件
,是扫描我的手写笔记。如何将它们转换为一个将
文件
名作为书签的
pdf
文件
? (我最终也想加入
ocr
。如前所述,我们可以使用.jpg将.
pdf
文件
转换为img2
pdf
.jp --output combined.
pdf
,然后可以使用ocrmypdf combined.
pdf
combined_
ocr
.
pdf
添加
ocr
。我的问题主要是如何确保<e
浏览 0
提问于2021-09-23
得票数 0
1
回答
是否可以使用Google脚本将位于Google中的不可搜索的
PDF
转换为可搜索的
PDF
?
、
、
、
我想使用Google 将不可搜索的
PDF
转换成可搜索的
PDF
,其中的文本是覆盖在
PDF
上的。
PDF
位于我的谷歌驱动器,我不想上传
文件
到另一个网站或下载的
文件
,以进行转换。我没有找到任何显示文本可以被覆盖的资源,类似于Acrobat如何进行
OCR
转换。那么,是否有可能使用气体进行覆盖呢?我只看到人们转换成文本或文档
文件
。
浏览 1
提问于2019-07-09
得票数 1
回答已采纳
4
回答
运行反引号/exec()时的PHP路径问题
、
、
我试图从命令行运行一个java jar
文件
,在执行过程中它会给出一个路径。在这条路径上,他们是空格,这是导致问题的原因。即$f = `java -jar /
OCR
/
ocr
.jar /Folder/$path /
ocr
/output.txt`;endforeach; 如果您可以看到子
文件
浏览 1
提问于2010-04-15
得票数 0
2
回答
ITextSharp在C#中无法读取
pdf
中的文本
、
、
我有两个
pdf
文件
。在Sercurity选项卡上,两个
文件
都设置了Security方法:无安全性和文档程序集:不允许,页提取:不允许。其他项目是允许的。我使用standart ITextSharp方法从
pdf
中检索文本: for,我可以从第二个
文件
中得到currentText的任何问题,我无法检索文本,currentText是空的。我在SodaPDF中打开了这个
文件</e
浏览 4
提问于2014-05-21
得票数 0
回答已采纳
1
回答
从
PDF
中获取树的
文件
(最好使用Python)
、
、
、
、
我想制作一系列
文件
,其中包含了这个
PDF
()中的树。
文件
的名称将是左边对应的树号(t0、t1等)。 我试图使用python提取相关信息和树,但我遇到了麻烦。我怎样才能从这个
PDF
中获取我想要的
文件
呢?能用Python完成吗?还有更简单的方法吗?或者,我获得
PDF
的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4#r#h NP#1#5#l#s NP
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
点击加载更多
相关
资讯
pdf文件真的不能修改吗?pdf如何编辑修改?
pdf不能编辑怎么办?pdf文件怎么才能编辑?
PDF怎么用OCR来识别文字,这个人工智能OCR工具绝了
PDF拆分成多个文件?这个方法不能不知道
通用 PDF OCR 到 Word API 数据接口
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券