Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何将pytesseract alto_xml的结果添加到原始图像中

如何将pytesseract alto_xml的结果添加到原始图像中
EN

Stack Overflow用户
提问于 2020-10-27 13:49:47
回答 1查看 341关注 0票数 0

我正在使用pytesseract创建可搜索的pdf。由于保持图像的原始外观很重要,因此我希望使用原始图像创建PDF。但是,为了改善OCR结果,我需要对图像进行一些预处理(纠偏、二值化等)。

以下是我如何使用处理后的图像获得pdf。

pdf = pytesseract.image_to_pdf_or_hocr(adaptive_threshold, lang="frk+deu", config=config)

那么,我如何应用alto_xml输出,例如:

alto= pytesseract.image_to_alto_xml(adaptive_threshold, lang="frk+deu", config=config)

并将其转换为pdf?像这样:

original_image + alto ->转换为可搜索的pdf。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2020-11-13 14:56:40

在pyhton中无法直接做到这一点,因为pytesseract只是Tesseract OCR命令行版本的python包装器

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64555910

复制
相关文章
在 Debian 中如何将用户添加到 Sudoers
sudo是一个命令行工具,它允许被信任用户以另外一个用户身份运行命令,默认是 root 用户。
雪梦科技
2020/05/11
12.7K0
在 Debian 中如何将用户添加到 Sudoers
在 Ubuntu 中如何将用户添加到 Sudoers
sudo是一个命令行程序,它允许被信任的用户以 root 或者其他用户身份去运行命令。
雪梦科技
2020/05/09
34.9K0
在 Ubuntu 中如何将用户添加到 Sudoers
如何将MV中的音频添加到EasyNVR中做直播背景音乐?
EasyNVR已经支持自定义上传音频文件,可以做慢直播场景使用,前两天有一个开发者提出一个问题:想把一个MV中的音频拿出来放到EasyNVR中去做慢直播。
EasyNVR
2021/10/28
4.3K0
如何将MV中的音频添加到EasyNVR中做直播背景音乐?
Nexus高级配置之如何将本地jar添加到Nexus中
Java后端技术所推送文章,为本人原创、网上收集或其他作者投稿,对于网上收集部分除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,我们会在24小时内删除处理,谢谢!^_^ QQ:1573876303。
Java后端技术
2018/08/09
2.8K0
Nexus高级配置之如何将本地jar添加到Nexus中
python pytesseract
python下没能成功安装pytesseract库 跑到在Mac下用brew安装tesseract,想绕一下让python调用shell进行图片识别 于是安装: ruby -e "$(curl -fs
程序员不务正业
2018/06/14
6420
热力图与原始图像融合
使用神经网络进行预测时,一个明显的缺陷就是缺少可解释性,我们不能通过一些简单的方法来知道网络做出决策或者预测的理由,这在很多方面就使得它的应用受限。 虽然不能通过一些数学方法来证明模型的有效性,但我们仍能够通过一些可视化热力图的方法来观测一下原始数据中的哪些部分对我们网络影响较大。 实现热力图绘制的方法有很多,如:CAM, Grad-CAM, Contrastive EBP等。在热力图生成之后,因为没有原始数据信息,所以我们并不能很直观地观测到模型到底重点关注了图像的哪些区域。这时将热力图叠加到原始图像上的想法就会很自然的产生。这里存在的一个问题是原始图像的色域空间可能和产生的热力图的色域空间是不一致的,当二者叠加的时候,会产生颜色的遮挡。并且因为产生的热力图的尺寸应该与原始图像尺寸一致或者调整到与原始尺寸一致,这样当二者直接简单地叠加的话,产生的图像可能并不是我们想要的,因此,我们需要先对热力图数据进行一些简单的像素处理,然后在考虑与原始图像的融合。以下部分的安排为:1. 热力图的产生 2. 热力图与原始图的叠加 3. 热力图与原始图融合优化
范中豪
2020/07/31
1.8K0
热力图与原始图像融合
如何将WebRTC播放协议添加到EasyCVR?
自2020年浏览器的发展和兼容性发生了变化,WebRTC的延时性、安全性得到了提升和保护,尤其是疫情爆发后,实时视频的需求比之前增长了30倍,这更刺激了WebRTC产品的持续快速发展。因此我们也在EasyGBS、EasyDSS等平台内实现了WebRTC协议的播放。
TSINGSEE青犀视频
2021/11/23
1.5K0
在Oracle中,如何将一个数据库添加到CRS中?
虽然通过DBCA(DataBase Configuration Assistant,数据库配置助手)创建的数据库会自动加入CRS中,但通过RMAN创建的数据库是不会被加入CRS中的,在这种情况下就需要手动添加,将数据库加入CRS中后就可以通过srvctl来管理数据库了。
AiDBA宝典
2023/04/26
2.9K0
在Oracle中,如何将一个数据库添加到CRS中?
在 CentOS 上如何将用户添加到 Sudoers
sudo是一个命令行工具,它被设计为允许用户以其他用户(默认是 root 用户)身份去运行命令。
雪梦科技
2020/05/11
11.6K0
在 CentOS 上如何将用户添加到 Sudoers
如何将HTML字符转换为DOM节点并动态添加到文档中
将字符串动态转换为DOM节点,在开发中经常遇到,尤其在模板引擎中更是不可或缺的技术。 字符串转换为DOM节点本身并不难,本篇文章主要涉及两个主题:<br />
用户1631416
2018/09/14
7.7K0
如何将HTML字符转换为DOM节点并动态添加到文档中
如何将SVG图像使用在HTML网站中
使用PS生成SVG图像用编辑器打开发现是data:img/png;base64而非/path
Din
2018/10/19
4.8K0
如何将SVG图像使用在HTML网站中
[未解决]报错: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in y
报错代码 try: from PIL import Image except ImportError: import image import pytesseract print(pytesseract.image_to_string(Image.open("images/words.png"))) 报错内容 pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in y
hankleo
2020/09/17
5500
zabbix 5.0如何将esxi6.7添加到监控
今天有个需求,需要将一台esxi 6.7 server添加到我们的zabbix监控服务器上,将我做的操作踩的一点坑写出来
姚华
2022/06/29
1.9K0
zabbix 5.0如何将esxi6.7添加到监控
pytesseract库的安装和使用
在写爬虫的时候总是遇到一些以图片的形式展示的信息,因此要怎么解析图片上的信息呢?在Google上查了一下,需要安装pytesseract和pillow(我用的python3.7)和Tesseract-OCR
py3study
2020/01/19
2K0
pytesseract库的安装和使用
如何将数据库检索的结果导出?
本文介绍了如何将不同数据库的检索结果导出,并提供了具体的数据库名单和导出方法。主要目的是方便用户对检索结果进行进一步处理。
企鹅号小编
2018/01/09
4.4K0
如何将数据库检索的结果导出?
基于OpenCV 的车牌识别
车牌识别是一种图像处理技术,用于识别不同车辆。这项技术被广泛用于各种安全检测中。现在让我一起基于OpenCV编写Python代码来完成这一任务。
小白学视觉
2020/09/04
7.8K0
如何将用户添加到Linux桌面【Linux-Command line】
我在 useradd command 上发布的文章阐述了对Linux系统用户管理的深层理解。Useradd 是一个命令行工具,但你也可以在Linux上通过图形方式管理用户。这就是本文主旨。
QRosie
2019/11/12
4.8K0
如何将用户添加到Linux桌面【Linux-Command line】
OpenCV中原始图像加载与保存压缩技巧
OpenCV中关于图像读写有两个函数imread与imwrite,imread加载的时候支持灰度图像、彩色图像、原始图像加载,默认情况下通过imread加载的图像都是三通道的BGR彩色图像。 但是实际上OpenCV支持加载任意通道的图像,首先来仔细再看一下imread函数
OpenCV学堂
2018/12/07
2.1K0
点击加载更多

相似问题

如何将by()调用的结果添加到原始dataframe中?

20

Pytesseract -错误的结果

17

如何将图像添加到原始面孔菜单中?

14

Pytesseract OCR在captcha图像上没有返回适当的结果

11

pytesseract不识别图像中的字符。

11
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档