如何使用Tesseract API遍历单词？

文章/答案/技术大牛

发布

0回答

、

我正在尝试与Tesseract API并行学习Python。我的最终目标是学习如何使用Tesseract API来读取文档并执行一些基本的错误检查。tesserocr import PyTessBaseAPI, RIL, iterate_level image = Image.open('/Users/chrysrobyn/tess-install/tesseract/scan_2_new.tif'

浏览 0提问于2016-12-30得票数 3

1回答

如何使用库来识别对象？

、

如何检测多个对象？谢谢!

浏览 2提问于2015-12-07得票数 2

1回答

OCR测试脚本配置

、

我正在使用Tesseract从图像中提取词汇表。谢谢!编辑:我运行这个命令从该图片中提取所有条目如您所见，值之间没有清晰的分隔符但是我不知道如何将每行的字符串分成两个字符串，因为缺少可用的分隔符。

浏览 0提问于2016-10-11得票数 0

8回答

使用python-tesseract获取识别单词的边界框。

、、、、

我使用从图像中提取单词。这是一个用于tesseract的python包装器，它是一个OCR代码。我使用以下代码获取单词：api.Init(".","eng",tesseract.OEM_DEFAULT) api.SetVariable("tessedit

浏览 20提问于2013-12-30得票数 56

回答已采纳

1回答

为什么tesseract：：结果词把汉语单词分解成单独的词？

、、

但是，当我使用指定坐标的getUTF8Text()时，它会返回正确的"简体中文"中文文本。如何使用ResultIterator获得正确的结果tesseract 5.0.0 libgif 5.1.9 : libjpeg 8d (libjpeg-turbo/baseapi.h> const char *pattern = "简体中文"; tesseract::TessB

浏览 7提问于2022-03-10得票数 0

回答已采纳

1回答

如何在Python中使用tesseract获取图像中最大的文本？

、、、

因此，我正在考虑将每个PDF文件的第一页转换为图像，并使用Tesseract读取此图像。我可以假设在图像上找到的最大文本是标题。page = doc.loadPage(0)pix.writePNG("output.png") 然后，我使用OpenCV读取图像文件，将其放入tesseract中，并在检测到的单词上放置边界

浏览 1提问于2021-03-25得票数 0

1回答

如何正确地从tess-two中提取文本和boxRects？

、、

我想用它们的边界框提取单词，但似乎无法使其工作。 val Text = tesseract.getUTF8Text() 给了我文本。val Words = tesseract.getWords.boxRects 给了我可以循环遍历的边界框，但它们与getUTF8Text()不匹配。遍历tesseract.getWords中的数据对象并尝试将其转换为字符串会让我感觉有点胡言乱语。使用.getHOCRText并在生成的内容上执行正则表达式来获取文本和方框。TextPatte

浏览 34提问于2019-02-27得票数 2

回答已采纳

2回答

从Python调用cpp函数时的故障分割

、、、

我正在尝试从python调用：TESS_API TessResultRenderer* TESS_CALL TessTextRendererCreate(const char* outputbase(outputbase) text_out = tesseract.TessBaseAPIProcessPages(<em

浏览 4提问于2016-04-26得票数 3

回答已采纳

2回答

如何提高节点JS和Tesseract.js的OCR精度？

、、

我使用tesseract.js来检测Node中的数字。例如，这就是我的形象：我运行我的脚本，它检测到这样的东西：由于图像中的噪声，它考虑了空间，其他符号，如逗号等。我是否可以指定，只指定数字，没有其他像空格和逗号这样的符号tesseract.recognize( 'eng'

浏览 4提问于2021-01-12得票数 0

回答已采纳

3回答

Tesseract OCR的高级用法

、、

我正在为我正在编写的应用程序使用Tesseract OCR。我只是想从我不时获得的图片中识别出某些区域上的文本。目前，基本的调用是有效的api.SetPageSegMode(tesseract::PSM_AUTO); // Segmentationon auto api.Init("/usr/local/share/",

浏览 2提问于2011-12-27得票数 1

回答已采纳

2回答

如何用C++中的tesseract制作可搜索的pdf

、、

我如何在代码中使用Tesseract API来做这件事？基本上，我想在代码中执行以下操作(我使用的是C++，但我很乐意接受其他语言的答案) $ tesseract -l eng+mar mydoc.jpg out pdf

浏览 2提问于2021-01-20得票数 0

1回答

初始化没有任何外部资源的tesseract (语言/字典)

、、

因为我没有读任何单词或句子，我不需要任何字典或语言。tesseract::TessBaseAPI api; // error handling}我还发现，我可以在不使用语言参数和使用</

浏览 2提问于2020-04-25得票数 0

回答已采纳

1回答

如何使用ctype和tesseract* 3.0.2识别非文件名的数据？*

、、

我使用ctypes和tesseract 3.0.2编写了一个片段，引用了from PIL import Image tesseract = ctypes.cdll.LoadLibrary(libname) rc = <

浏览 4提问于2012-10-31得票数 2

1回答

Tess4j结果迭代器

、、、

} return name;其中subc是图像已经切割和预处理的单词我想要的要么是获得图像识别的信心，要么迭代第一个，比方说，30个最有可能的单词。我已经找到了像这个这样的例子，但是它在第一行就中断了，当我把我的对象“实例”作为参数"api</e

浏览 5提问于2013-11-01得票数 0

回答已采纳

1回答

不使用词表为tesseract* 3.03生成eng.traineddata*

、

我要做的是从图像中提取文本，我实际上是在windows上使用python包装器为tesseract 3.03，我已经下载了许多语言(英语，法语，...)的.traineddata文件。.the问题是我在某处读到tesseract在检测到分隔字符后尝试使用单词列表文件来检测单词。我的问题是如何在不使用词表的情况下生成.traineddata文件，因为我希望tesseract返回检测到的句子而不验证单词

浏览 2提问于2017-05-04得票数 0

2回答

如何在C++中使用Tesseract* OCR获取文本位置？*

、、、、

我正在opencv-2.x中使用C++在身份证中进行字符识别。我尝试了Tesseract OCR，但是它并没有给我比我自己的neural network训练更好的结果。虽然，我仍然在挣扎于字符的切分。我想知道是否有可能从Tesseract OCR Api获得C++中的字符或单词位置，并使用my neural network进行预测。有什么建议吗？简单地说，我需要使用Tesseract.对ID中的每个字符进行包围框。

浏览 2提问于2016-01-28得票数 0

1回答

如何提高来自Tesseract的OCR文本的准确性？

、、、、

我使用谷歌的Tesseract API创建了一个识别文本的基本应用程序，并将其与我的相机应用程序集成在一起。此外，当它试图扫描图像中超过四个单词时，应用程序会崩溃。String ocrText = baseApi.getUTF8Text();其中baseApi是Tesseract API类的对象。我是否需要使用不同的数据结构来保存已识别的文本，或者是否有其他原因导致四个以上的单词无法识别？

浏览 2提问于2012-07-03得票数 3

回答已采纳

2回答

提高多段扫描的OCR性能

、、

我尝试通过它的绑定使用Tesseract引擎，但是结果非常令人失望。import tesseract api = tessera

浏览 8提问于2012-07-25得票数 23

回答已采纳

1回答

如何使用Tesseract* OCR从身份证上读取单词？*

、、

我正在使用Tesseract图书馆从身份证信息中读取信息，我得到了每个单词或每一行的信心分数。这是使用的代码Pix *image = pixRead("/usr/src/tesseract-3.02/phototest.tif&qu

浏览 0提问于2014-09-05得票数 8

1回答

tesseract OCR中的标记字体样式(斜体)

、、、

已在Windows 7上安装tesseract-ocr v3.02.02，并已通过命令行使用：我需要它能够标记输出文本或html文件中的任何斜体文本。我该怎么做(最好是在命令行上--永远不要在API模式下使用它)？

浏览 2提问于2014-09-22得票数 0

点击加载更多