腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
从
包含
各种
嘈杂
文本
和
数字
的
图像
中
提取
文本
?
python-3.x
、
python-tesseract
、
text-extraction
、
amazon-textract
我需要从这个
图像
中
提取
仪表读数,这是"0005053“在中心。= pytesseract.image_to_string(Image.open("Screen_Shot_2564-08-25_at_11.23.13.png")) print(text) 我得到
的
输出是我发现
的
另一个服务是AWS Textract,它非常准确,但我找不到一个用python实现它
的
变通方法。任何线索都将不胜感激。 有什么办法解决这个问题吗? 谢谢
浏览 25
提问于2021-08-26
得票数 0
回答已采纳
1
回答
如何
用Microsoft.media.ocr制作带有包围框覆盖
的
实时摄像头,这样用户就可以在UWP
中
触摸
和
使用
文本
到语音?
windows
、
uwp
、
ocr
我已经实现了实时摄像头
和
使用Android
文本
识别,当我触摸边界框覆盖,
文本
到语音作品,但在通用窗口,应用程序无法获得任何文档,谁能帮助
如何
实现在实时相机OCR?
浏览 0
提问于2018-04-16
得票数 0
回答已采纳
3
回答
如何
使用OpenCV获取
图像
中所有
文本
的
位置?
python
、
opencv
、
machine-learning
、
image-processing
、
deep-learning
我有一个
图像
,其中
包含
文字(
数字
和
字母)。我想知道这张图片中所有
文本
和
数字
的
位置。另外,我也想
提取
所有的
文本
。
如何
获取
图像
中
的
坐标以及所有
文本
(
数字
和
字母)?
浏览 2
提问于2020-01-17
得票数 9
回答已采纳
1
回答
如何
提高Tesseract
的
效果
c++
、
image
、
opencv
、
image-processing
、
tesseract
我希望在使用OpenCV
和
tesseract时检测
图像
中
的
文本
。我
的
步骤是: 然而,tesseract
浏览 3
提问于2017-03-02
得票数 3
1
回答
Azure OCR或其他Azure认知功能从PDF
中
读取
文本
azure
、
pdf
、
computer-vision
我有一个项目,我必须
从
URL或Blobs
中
读取PDF,并从其中
提取
文本
以供使用Azure认知索引/搜索/我正在学习使用计算机视觉
的
示例,并且只能解析
和
提取
图像
文件
中
的
文本
。我环顾了一下,发现有些人提到了这种功能,但是它非常稀少,我找不到Github
的
例子来做PDF文档。 任何关于在哪里寻找
的
建议或建议。我知道亚马逊有纺织品,但我
的</e
浏览 2
提问于2021-02-15
得票数 2
回答已采纳
1
回答
如何
区分PHP
中
的
“
文本
”PDF
和
“
图像
”PDF?
php
、
pdf
、
tesseract
、
ghostscript
、
xpdf
我最近建立了一个Linux服务器,可以使用Xpdf
的
一部分pdftotext命令将基于
文本
的
Xpdf转换为
文本
,还可以使用gs (Ghostscript)
和
tesseract命令
的
组合将基于
图像
的
Xpdf转换为
文本
。当我已经知道PDF是基于
文本
还是基于
图像
时,这两种解决方案都能很好地工作。但是,为了自动化将许多PDF转换为
文本
的
过程,我需要能够判断PDF是基于<e
浏览 5
提问于2016-09-23
得票数 1
回答已采纳
3
回答
如何
提取
OCR特定颜色
的
像素?
image-processing
、
imagemagick
、
ocr
、
tesseract
、
vips
我想通过OCR (可能是Tesseract)运行一些小
图像
/精灵,并从中
提取
一个或多个单词,我知道这些
数字
/单词将具有特定
的
颜色(让我们在
嘈杂
/有色
的
背景上说是白色
的
)。在阅读关于OCR
图像
预处理
的
文章时,我认为只
从
图像
中
删除所有非白色
的
东西是非常有益
的
。 我同时使用imagemagick
和
vips
浏览 2
提问于2020-08-07
得票数 2
回答已采纳
1
回答
如何
使用pdfbox获得pdf
的
最大fontsize
object
、
font-size
、
pdfbox
、
pdf-extraction
我使用pdfbox
从
pdf中
提取
一些信息,但是
如何
提取
每个对象
的
信息?如果其中一个
包含
流,我
如何
解码该流以显示? 我能从一个pdf框
中
得到最大字体大小
的
吗?我想如果我能得到每个对象
的
字体大小并对它们进行排序,那么我就得到了具有最大字体大小
的
对象?
浏览 8
提问于2015-03-23
得票数 1
1
回答
OCR识别奇怪
的
字符。为什么?
character
、
ocr
我正在使用OCR通过tess-two项目开发一个使用Tesseract Libs
的
安卓应用程序,就像我在这里看到
的
:在搜索
中
,我配置了这个:baseApi.setVariable("tessedit
浏览 1
提问于2012-11-22
得票数 1
1
回答
通过html编辑pdf
android
、
pdf
、
annotations
、
itext
、
ocr
我不确定这里是否适合这个问题,但我找不到任何其他
的
建议媒介。
浏览 3
提问于2013-06-02
得票数 0
回答已采纳
3
回答
我怎样才能提高Tesseract
的
结果质量?
ios
、
swift
、
tesseract
我正在尝试使用Tesseract
的
OCR
从
法国
的
重要卡
中
读取NIRPP号码(社会保险号码)(我使用
的
是TesseractOCRiOS 4.0.0)。所以我要做
的
是: 然后,使用自定义裁剪器,我要求用户对卡号进行具体缩放:然后,我捕捉到这个
图像
,(1291x202px),使用Tesseract,我试着读取这个
数字
: let tesseract = G8Tesseract(langu
浏览 2
提问于2018-08-17
得票数 0
1
回答
如何
对
中
较大句子
的
一部分块进行分组?
ocr
、
google-cloud-vision
我正在使用Google Cloud Vision API on Python来检测囤积板
中
通常在商店/商店上面发现
的
文本
值。到目前为止,我已经能够检测到单个单词及其包围多边形
的
坐标。是否有方法根据检测到
的
单词
的
相对位置
和
大小对其进行分组? 例如,存储
的
名称通常是相同大小
的
,并且单词是对齐
的
。API是否提供了一些函数,将可能是较大句子(商店名称或地址等)
的
单词分组?如果API没有提供这样<e
浏览 1
提问于2018-09-18
得票数 0
回答已采纳
1
回答
IE6 -打印样式表上
的
有序列表错误?
css
、
printing
、
internet-explorer-6
我已经为一个页面创建了一个打印样式表,其中
包含
包含
各种
文本
和
图像
的
列表项。内容在“正确
的
浏览器”
中
按预期打印,但
数字
从
IE6
中
的
列表项
中
消失。有什么想法吗?
浏览 0
提问于2011-02-03
得票数 0
回答已采纳
1
回答
截图中
的
Copy+Paste
thunderbird
、
ocr
、
copy-and-paste
我在日常工作
中
收到了很多截图。是否有一种
从
图像
中
获取copy+paste
数字
的
神奇方法? 我用雷鸟
和
火狐看屏幕截图。这个问题是关于简单
的
奶奶兼容
的
将OCR集成到桌面上。我不想玩砖头,我想要一个每天都很容易使用
的
解决方案。我在2001年(18年前)在ms-windows上看
浏览 0
提问于2019-01-04
得票数 2
3
回答
计算机视觉
computer-vision
、
text-extraction
我试图
从
视频帧
和
图像
中
提取
文本
。github中提供
的
大多数代码都与python <3版本兼容。任何关于
如何
进行
和
获取相关代码和好文件
的
想法。注意:我已经实现了pytesseract-OCR,而且没有取得好
的
效果。
浏览 8
提问于2018-05-28
得票数 1
回答已采纳
3
回答
C# PDFSharp:
如何
从
PDF
中
剥离
文本
的
示例?
c#
、
text
、
pdfsharp
我有一个相当简单
的
任务:我需要读取一个PDF文件并写出它
的
图像
内容,而忽略它
的
文本
内容。所以基本上我需要做“另存为
文本
”
的
补充。理想情况下,我希望避免对
图像
内容进行任何形式
的
重新压缩,但如果这不可能,也没问题。谢谢!
浏览 0
提问于2012-03-07
得票数 6
回答已采纳
2
回答
从
SAS
中
的
文本
字符串中
提取
6位
和
8位
数字
。
sql
、
sas
、
proc-sql
长时间读者,第一次海报我想从一个自由
文本
字段返回一组
数字
。该字段
包含
以下内容之一: 以上
数字
和
一个6位数,有时被
各种
标点符号分割成2组。
浏览 5
提问于2016-01-20
得票数 1
回答已采纳
2
回答
苹果视觉框架: LCD/LED
数字
识别
machine-learning
、
computer-vision
、
coreml
、
apple-vision
、
createml
我正在开发一个iOS应用程序,一切看起来都很好,直到我尝试捕捉
数字
时钟、计算器、血压监视器、电子温度计等
图像
。由于某种原因,
和
无法识别原始液晶屏幕上
的
文本
,比如:您可以尝试用捕获
数字
,结果会失败。或者您可以尝试“视觉框架”
的
任何其他示例项目,但是它将无法将
数字
识别为
文本
。
浏览 5
提问于2020-03-25
得票数 2
回答已采纳
2
回答
如何
最好地逼近局部阈值opengl函数
opengl
、
image-processing
我想拍一些文字
的
照片,使
文本
更容易阅读。棘手
的
部分是,最初
的
照片可能有黑暗区域
和
光区域,我想要opengl
的
功能,以增强所有这些区域
的
文本
。 编辑后,我添加了一个更好
的
例子图片正在发生什么。我能够增强
文本
,但在我没有
文本
的
领域,这种简单
的
阈值处
浏览 2
提问于2011-12-29
得票数 4
回答已采纳
1
回答
我们可以使用Selenium
从
图像
中
获取
文本
吗?
selenium-webdriver
、
testng
、
page-objects
、
eclipse
这是
图像
的
路径,为了安全起见,我必须将显示在
图像
上
的
文本
输入到
文本
中
, private WebElement textShown; 这是XPath,我在这里填充
图像<
浏览 0
提问于2023-03-05
得票数 -1
回答已采纳
点击加载更多
相关
资讯
Excel数字提取技巧:从混合文本中提取数字的方法
文字识别:如何快速精准的从图片中提取文本!
可以识别和翻译图像中的文本
一个基于Unicode的文本数字水印工具,用于在文本内容中嵌入不可见的版权标识和元数据信息。
人工智能如何识别和纠正文本中的语法和拼写错误……
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券