首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用doc取器在PDF文件中搜索文本?

如何使用doc取器在PDF文件中搜索文本?
EN

Ask Ubuntu用户
提问于 2016-08-16 20:26:52
回答 1查看 1.5K关注 0票数 0

我试图在PDF文件中找到一些文本,但结果并不准确!举个例子,我有两个PDF文件,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个PDF文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个PDF文件?PDF文件之间有什么区别吗?在一个PDF中,我只有文本,而其他PDF是文本和图像,这是从扫描页面。陷阱是什么?

P.S.:这两个PDF文件位于同一个目录中。

EN

回答 1

Ask Ubuntu用户

回答已采纳

发布于 2016-08-16 20:37:48

只有文本的PDF文件和扫描页面的文本和图像的PDF文件有什么区别吗?

是的,带有文本的PDF文件和带有扫描图像的PDF文件是不同的。在基于图像的pdf中,计算机只看到图像,在这些图像中识别文本需要在PDF引擎中内置额外的功能,比如光学字符识别。由于计算机可以直接识别文本,因此带有文本的PDF更容易被计算机搜索。

Recommendation

票数 3
EN
页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://askubuntu.com/questions/813069

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档