腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用Firebase ML工具包
识别
PDF
文件
中
的文本?
、
、
我正在开发一个Android应用程序来检测
PDF
文件
中
的文本。 我试着测试更多的文件格式:
浏览 1
提问于2019-03-07
得票数 0
2
回答
Acrobat XI Pro喜欢
pdf
阅读器
、
、
我如何安装一个
PDF
阅读器,像“杂技XI专业”,让我突出文本,有
文字
识别
,让我组合和转换
PDF
格式和其他格式?
浏览 0
提问于2015-02-02
得票数 0
2
回答
可将OCR文本插入回源
PDF
的OCR库
、
是否有库(或可执行文件)可以OCR
PDF
(通常是通过扫描纸张创建的
PDF
),并将
识别
出的文本重新注入到
PDF
中
?很可能是扫描图像背后的隐形
文字
。 最好是开源的。(目标:我有一个巨大的由Lucene索引的
PDF
文件库。如果
PDF
包含文本,Lucene将更容易找到哪些
PDF
是相关的。)
浏览 3
提问于2011-02-28
得票数 2
1
回答
查找没有文本的
PDF
、
、
我有很多文件夹与很多
PDF
,我想要光学字符
识别
那些没有
文字
层。所以首先,我想找到他们。我以为也许用pdfgrep的烟斗就能做好这份工作,但我迷路了。 如何找到没有文本的
PDF
?
浏览 0
提问于2021-01-15
得票数 5
回答已采纳
2
回答
除
PDF
以外的所有文件链接的JS RegEx
、
我正在尝试匹配HTML文档
中
包含特定文件夹链接的所有href属性,而不是
PDF
。我很难让它匹配,我有一个可以得到所有
PDF
的:但我排除
PDF
的尝试并没有让我走得太远。有没有办法做我想要的,或者我只是匹配所有的文件而不是使用条件语句来检查它是否是
PDF
?谢谢!
浏览 1
提问于2013-06-04
得票数 0
2
回答
柬埔寨字母表上的交货单
、
、
我得到了一个问题与Prestashop 1.7.4.2交货单,它不能
识别
高棉
文字
母。有谁可以帮助我用哪种字体来显示这些字母? 我已经在\override\classes\
pdf
\PDFGenerator.php
中
添加了支持的字体,但它不起作用。
浏览 1
提问于2020-06-10
得票数 2
1
回答
使用Java和Itext编辑
PDF
文本
、
有办法编辑
PDF
文档文本吗?比如找到和替换特定的文本?我能够编辑特定坐标(x,y)的
pdf
,但无法
识别
和替换。我看到的所有库都是从零开始创建的
PDF
和小的编辑功能。不管怎样,我可以用itext编辑上面的解释吗?请advise...thank你!是最古老的古希腊
浏览 5
提问于2014-07-10
得票数 2
1
回答
关于拆分
PDF
和OCR
识别
、
、
、
我有很多
pdf
文档,它们都是扫描过的
文字
版本。我需要在
pdf
中
拆分一个页面。 例如,如果有1个页面。我需要将一页分成页眉部分,页脚部分,主体部分和侧面部分。我知道Python的
PDF
和OCR库,但我找不到任何关于拆分单个页面的内容。 然后,最后希望将
pdf
页面的拆分部分传递给OCR,以
识别
字符并将输出转换为csv或文本文件。 提前感谢您……
浏览 18
提问于2021-04-20
得票数 0
回答已采纳
1
回答
OCR可以
识别
PDF
文件吗?
浏览 187
提问于2022-06-15
1
回答
读取内容流时出错
、
、
我正致力于捕获对show的postscript调用,并将当前字体和字体大小存储到
pdf
文本对象
中
输出。但是identify给了我一个错误: **** Error reading a content stream.pd0.
pdf
[0] PBM 612x792 612x792+0+0 16-bit Bilevel Gray 61KB 0.000u 0:00.000 pd0.
pdf
[1] PBM 612x792 612x792+0+0 16-bit Bilevel G
浏览 1
提问于2018-02-12
得票数 0
回答已采纳
1
回答
哪种中
文字
体是中国人民的
PDF
阅读器普遍支持的?
、
我正在生成
PDF
文件,其中包含英文和中
文字
符(使用Ruby对虾库)。我不想在生成的
PDF
文件
中
嵌入中
文字
体文件,因为这些文件需要保持较小。所以,我想知道我是否可以在
PDF
文件中提到一个中
文字
体名,让
PDF
阅读器正确地呈现汉字,因为
PDF
阅读器已经有了中
文字
体文件。 这有道理吗?如果是这样的话,在大多数中国人使用的
PDF
阅读器
中
是否会安装一些常用的中
文字
体?
浏览 2
提问于2015-05-06
得票数 2
回答已采纳
1
回答
PDF
中
未
识别
的字形(总结显示,总结
文字
)
、
、
我正在尝试处理一个
PDF
与
pdf
阅读器宝石。这基本上是好的,但是哪里应该有求和符号,我得到的是\u0001而不是\u2211。/lib/
pdf
/reader/glyphlist.txt上复制)只包含summation,而不包括summationtext或summationdisplay,所以@differences不会在
PDF
::Reader::Encoding#differences=
中
应用于@mapping,而且@state.current_font.to_ut
浏览 0
提问于2016-08-25
得票数 0
回答已采纳
1
回答
从
PDF
文件中提取文档信息,比如页边距宽度?
我使用了qpdf和pdfinfo等工具从poppler获得有关
PDF
文档的信息。然而,我正在寻找一种方法,以获得更具体的信息,如宽度的边距,字体家族使用的,等等。然而,qpdf有一个--json选项,它将
PDF
转换成它的JSON表示形式。我对JSON非常熟悉,但是找不到任何叫做“边距”或“字体-家庭”的属性。这样的信息是否以
PDF
格式记录?我的主要目标是能够复制文档
中
的所有页边距/字体信息(假设它们是一致的,并且是从TeX或LaTeX之类的程序中生成的),这样我就可以复制它们的精确样式。现在,我必须使用
P
浏览 0
提问于2021-09-14
得票数 1
1
回答
jasper报表的
pdf
中
中文不支持粗体?
、
我已经使用jasper报告导出为
pdf
。在报告
中
,英
文字
符支持粗体,但中
文字
符不支持。
Pdf
embedded: true
pdf
encoding: uniGB-UCS2-H
浏览 5
提问于2013-01-16
得票数 0
1
回答
直接编辑
PDF
然后删除编辑仍然会导致
pdf
损坏。
我的
PDF
看起来很好,直到我编辑了它,现在它似乎仍然被破坏,即使我删除了我的编辑。文件diff程序表示这两个文件是相同的,但只有一个文件显示信息。复制:2)在文本编辑器
中
打开
PDF
并在顶部添加文本4)删除步骤2
中
添加的文本是否有任何方
浏览 5
提问于2017-07-27
得票数 0
回答已采纳
2
回答
如何在用iTextSharp创建的
pdf
文件
中
显示汉字
、
我有字符串数据,其中包含一些英
文字
符和一些中
文字
符。我使用iTextSharp用这些数据创建了一个
pdf
文件。
pdf
文件创建后,当我打开它时,
pdf
只包含英
文字
符。它不显示汉字。你能告诉我如何在
pdf
文件
中
显示汉字吗?请注意,我写入
pdf
的字符串数据包含动态语言字符,即有时是英语,有时是中文,有时是日语等等。
浏览 2
提问于2013-02-21
得票数 3
回答已采纳
1
回答
帮助Canon CanoScan LiDE扫描
PDF
文档
、
、
、
当我使用Windows 7
中
的扫描仪,并将扫描过的书籍页保存为
PDF
格式时,我可以打开
PDF
扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我通过简单的扫描将页面扫描为文本,并将其保存为
PDF
格式。但是在Ubuntu
中
,当我打开扫描的
PDF
页面时,它会打开OK,但是我不能复制文本。
浏览 0
提问于2014-03-16
得票数 2
回答已采纳
1
回答
使用iTextSharp从
PDF
中提取盲文文本(图像)
、
、
、
、
我正在尝试解码以盲
文字
体编写的
PDF
文件
中
的文本,并输出正常的文本。但是PDFTextExtractor (在iTextSharp
中
)不能处理这种字体。有没有可能用其他方式?我想知道如何从
pdf
文件
中
解码。我试着用,string text = PdfTextExtractor.GetTextFromPage(例如Arial)和
浏览 3
提问于2011-08-07
得票数 1
回答已采纳
1
回答
从零开始生成
PDF
,如何将象形
文字
映射到字符代码?
、
、
、
我想要生成一个便携式文件格式(
PDF
)由我的原始程序。我将尝试一个原始排版程序,在开发过程
中
,我希望尽可能避免外部工具和字体。因此,最好避免使用XeTeX、LuaTeX和其他引擎。我想将字形信息存储在我的程序或我的库
中
。,但是应该在哪里指定字符代码,以便查看程序知道它们何时被复制或搜索?是否可以将图
浏览 1
提问于2019-09-15
得票数 1
2
回答
docx转换为朝鲜语字体的
pdf
、
、
、
这是关于docx到
pdf
的转换,在docx文档中有韩语签名。我可以用docx4j把一个文档转换成
pdf
。 在
pdf
文档
中
,我可以看到结果。但是如果我的docx文档包含韩
文字
体,我在
pdf
文档中看不到任何韩
文字
体,除了拉丁数字。我必须做什么才能从docx文档
中
获得我的
pdf
中
的韩
文字
体?wordprocessingMLPackage = WordprocessingMLPackage.load(doc
浏览 4
提问于2013-10-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么识别pdf中的文字?这有pdf的文字识别方法
如何识别pdf中的文字,几步教你轻松识别
pdf文字识别,教你一个提取pdf文字的方法
如何识别pdf中的文字,一个方法轻松搞定
PDF文字识别软件哪个好?试试这些PDF识别软件吧
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券