腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
如何
使用
Tesseract
API
遍历
单词
?
、
我正在尝试与
Tesseract
API
并行学习Python。我的最终目标是学习
如何
使用
Tesseract
API
来读取文档并执行一些基本的错误检查。tesserocr import PyTessBaseAPI, RIL, iterate_level image = Image.open('/Users/chrysrobyn/tess-install/
tesseract
/scan_2_new.tif'
浏览 0
提问于2016-12-30
得票数 3
1
回答
如何
使用
库来识别对象?
、
如何
检测多个对象?谢谢!
浏览 2
提问于2015-12-07
得票数 2
1
回答
OCR测试脚本配置
、
我正在
使用
Tesseract
从图像中提取词汇表。谢谢!编辑:我运行这个命令从该图片中提取所有条目如您所见,值之间没有清晰的分隔符但是我不知道
如何
将每行的字符串分成两个字符串,因为缺少可用的分隔符。
浏览 0
提问于2016-10-11
得票数 0
8
回答
使用
python-
tesseract
获取识别
单词
的边界框。
、
、
、
、
我
使用
从图像中提取
单词
。这是一个用于
tesseract
的python包装器,它是一个OCR代码。我
使用
以下代码获取
单词
:
api
.Init(".","eng",
tesseract
.OEM_DEFAULT)
api
.SetVariable("tessedit
浏览 20
提问于2013-12-30
得票数 56
回答已采纳
1
回答
为什么
tesseract
::结果词把汉语
单词
分解成单独的词?
、
、
但是,当我
使用
指定坐标的getUTF8Text()时,它会返回正确的"简体中文"中文文本。
如何
使用
ResultIterator获得正确的结果
tesseract
5.0.0 libgif 5.1.9 : libjpeg 8d (libjpeg-turbo/baseapi.h> const char *pattern = "简体中文";
tesseract
::TessB
浏览 7
提问于2022-03-10
得票数 0
回答已采纳
1
回答
如何
在Python中
使用
tesseract
获取图像中最大的文本?
、
、
、
因此,我正在考虑将每个PDF文件的第一页转换为图像,并
使用
Tesseract
读取此图像。我可以假设在图像上找到的最大文本是标题。page = doc.loadPage(0)pix.writePNG("output.png") 然后,我
使用
OpenCV读取图像文件,将其放入
tesseract
中,并在检测到的
单词
上放置边界
浏览 1
提问于2021-03-25
得票数 0
1
回答
如何
正确地从tess-two中提取文本和boxRects?
、
、
我想用它们的边界框提取
单词
,但似乎无法使其工作。 val Text =
tesseract
.getUTF8Text() 给了我文本。val Words =
tesseract
.getWords.boxRects 给了我可以循环
遍历
的边界框,但它们与getUTF8Text()不匹配。
遍历
tesseract
.getWords中的数据对象并尝试将其转换为字符串会让我感觉有点胡言乱语。
使用
.getHOCRText并在生成的内容上执行正则表达式来获取文本和方框。TextPatte
浏览 34
提问于2019-02-27
得票数 2
回答已采纳
2
回答
从Python调用cpp函数时的故障分割
、
、
、
我正在尝试从python调用:TESS_
API
TessResultRenderer* TESS_CALL TessTextRendererCreate(const char* outputbase(outputbase) text_out =
tesseract
.TessBaseAPIProcessPages(<em
浏览 4
提问于2016-04-26
得票数 3
回答已采纳
2
回答
如何
提高节点JS和
Tesseract
.js的OCR精度?
、
、
我
使用
tesseract
.js来检测Node中的数字。例如,这就是我的形象:我运行我的脚本,它检测到这样的东西:由于图像中的噪声,它考虑了空间,其他符号,如逗号等。我是否可以指定,只指定数字,没有其他像空格和逗号这样的符号
tesseract
.recognize( 'eng'
浏览 4
提问于2021-01-12
得票数 0
回答已采纳
3
回答
Tesseract
OCR的高级用法
、
、
我正在为我正在编写的应用程序
使用
Tesseract
OCR。我只是想从我不时获得的图片中识别出某些区域上的文本。目前,基本的调用是有效的
api
.SetPageSegMode(
tesseract
::PSM_AUTO); // Segmentationon auto
api
.Init("/usr/local/share/",
浏览 2
提问于2011-12-27
得票数 1
回答已采纳
2
回答
如何
用C++中的
tesseract
制作可搜索的pdf
、
、
我
如何
在代码中
使用
Tesseract
API
来做这件事?基本上,我想在代码中执行以下操作(我
使用
的是C++,但我很乐意接受其他语言的答案) $
tesseract
-l eng+mar mydoc.jpg out pdf
浏览 2
提问于2021-01-20
得票数 0
1
回答
初始化没有任何外部资源的
tesseract
(语言/字典)
、
、
因为我没有读任何
单词
或句子,我不需要任何字典或语言。
tesseract
::TessBaseAPI
api
; // error handling}我还发现,我可以在不
使用
语言参数和
使用</
浏览 2
提问于2020-04-25
得票数 0
回答已采纳
1
回答
如何
使用
ctype和
tesseract
3.0.2识别非文件名的数据?
、
、
我
使用
ctypes和
tesseract
3.0.2编写了一个片段,引用了from PIL import Image
tesseract
= ctypes.cdll.LoadLibrary(libname) rc = <
浏览 4
提问于2012-10-31
得票数 2
1
回答
Tess4j结果迭代器
、
、
、
} return name;其中subc是图像已经切割和预处理的
单词
我想要的要么是获得图像识别的信心,要么迭代第一个,比方说,30个最有可能的
单词
。我已经找到了像这个这样的例子,但是它在第一行就中断了,当我把我的对象“实例”作为参数"
api</e
浏览 5
提问于2013-11-01
得票数 0
回答已采纳
1
回答
不
使用
词表为
tesseract
3.03生成eng.traineddata
、
我要做的是从图像中提取文本,我实际上是在windows上
使用
python包装器为
tesseract
3.03,我已经下载了许多语言(英语,法语,...)的.traineddata文件。.the问题是我在某处读到
tesseract
在检测到分隔字符后尝试
使用
单词
列表文件来检测
单词
。我的问题是
如何
在不
使用
词表的情况下生成.traineddata文件,因为我希望
tesseract
返回检测到的句子而不验证
单词
浏览 2
提问于2017-05-04
得票数 0
2
回答
如何
在C++中
使用
Tesseract
OCR获取文本位置?
、
、
、
、
我正在opencv-2.x中
使用
C++在身份证中进行字符识别。我尝试了
Tesseract
OCR,但是它并没有给我比我自己的neural network训练更好的结果。虽然,我仍然在挣扎于字符的切分。我想知道是否有可能从
Tesseract
OCR
Api
获得C++中的字符或
单词
位置,并
使用
my neural network进行预测。有什么建议吗?简单地说,我需要
使用
Tesseract
.对ID中的每个字符进行包围框。
浏览 2
提问于2016-01-28
得票数 0
1
回答
如何
提高来自
Tesseract
的OCR文本的准确性?
、
、
、
、
我
使用
谷歌的
Tesseract
API
创建了一个识别文本的基本应用程序,并将其与我的相机应用程序集成在一起。此外,当它试图扫描图像中超过四个
单词
时,应用程序会崩溃。String ocrText = baseApi.getUTF8Text();其中baseApi是
Tesseract
API
类的对象。我是否需要
使用
不同的数据结构来保存已识别的文本,或者是否有其他原因导致四个以上的
单词
无法识别?
浏览 2
提问于2012-07-03
得票数 3
回答已采纳
2
回答
提高多段扫描的OCR性能
、
、
我尝试通过它的绑定
使用
Tesseract
引擎,但是结果非常令人失望。import
tesseract
api
=
tessera
浏览 8
提问于2012-07-25
得票数 23
回答已采纳
1
回答
如何
使用
Tesseract
OCR从身份证上读取
单词
?
、
、
我正在
使用
Tesseract
图书馆从身份证信息中读取信息,我得到了每个
单词
或每一行的信心分数。这是
使用
的代码Pix *image = pixRead("/usr/src/
tesseract
-3.02/phototest.tif&qu
浏览 0
提问于2014-09-05
得票数 8
1
回答
tesseract
OCR中的标记字体样式(斜体)
、
、
、
已在Windows 7上安装
tesseract
-ocr v3.02.02,并已通过命令行
使用
:我需要它能够标记输出文本或html文件中的任何斜体文本。我该怎么做(最好是在命令行上--永远不要在
API
模式下
使用
它)?
浏览 2
提问于2014-09-22
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券