linux tesseract_tesseract linux_tesseract - 腾讯云开发者社区

、、

我试图使用appimagetool()来创建OCR程序tesseract()的单二进制可执行文件。我已经在Ubuntu19.10上构建了tesseract，我希望在Ubuntu14.01上运行可执行文件。注意:我无法控制旧版本的Ubuntu，我需要后期版本的tesseract中的特性。我已经尝试过一个现有的tesseract AppImage，它失败的方式类似于下面的详细内容。遵循本教程：我创建了一个具有必要布局的tesseract.AppDir： tesseract.AppDir/AppRun tesseract.AppDir/.DirIcon tesseract.AppDir/tess

浏览 4提问于2020-10-28得票数 1

回答已采纳

1回答

在Linux系统上安装Python-Tesseract

、、、、

在我的linux系统上安装python-tesseract时遇到了问题。我一直在使用这个教程：我得到的错误是： File does not exist:['/usr/include/tesseract/capi.h', '/usr/local/include/tesseract/capi.h', '/opt/include/tesseract/capi.h', '/opt/local/include/tesseract/capi.h'] root@opencv:/home/philipp/python-tesseract# 按

浏览 1提问于2015-08-07得票数 1

1回答

升级linux中的tesseract版本

、、

我对linux非常陌生，我刚刚开始学习linux的基础知识。我们有一个名为tesseract的包，它在测试和开发环境中有不同的版本。我无法更新tesseract版本，因为它提供了以下内容 apt-get install tesseract-ocr tesseract-ocr is already the newest version (3.04.01-5) 0 upgraded, 0 newly installed,0 to remove and 1 not upgraded 但是，当我在dev环境中检查版本时 tesseract -v tesseract 4.1.1 leptonica

浏览 2提问于2021-10-22得票数 0

1回答

不支持TSV输出。AWS服务器所需的Tesseract >=3.05

、、、、

tesseract 3.04.00可在AWS Linux服务器上使用。当我尝试使用pytesseract.image_to_data()函数时，它会给出运行时错误，例如"TSV不支持. Tesseract >= 3.05必需“ 那么我该如何解决这个问题呢？提示*我安装了tesseract使用贝洛尔提到的代码 https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm yum -y update yum -y install tesseract AWS服务器信息 NAME="Amazon L

浏览 15提问于2022-01-28得票数 0

1回答

在python中没有OCR工具

、、

我已经从GitHub下载了Mayan电子文档管理系统，并使用Django服务器配置了项目。我根据需求添加了所需的库。现在，该项目运行错误。 ocr.exceptions.OCRError: No OCR tool found 当我搜索这个错误时，我发现Pyocr查找安装在您的系统上的OCR工具(Tesseract、Cuneiform等)，并告诉您它找到了什么。然后我尝试使用命令->pip安装tesseract-ocr来安装tesseract。我犯了这个错误 Requirement already satisfied: cython in ./venv2/lib/python2

浏览 1提问于2018-07-16得票数 3

回答已采纳

1回答

将tesseract-ocr作为来自MATLAB的外部命令运行时出错

、、、、

我正在尝试使用从matlab运行tesseract 3.04。第2行和第3行错误的含义是什么？ 1 !tesseract im.tif imTif 2 >> tesseract: /usr/local/MATLAB/R2016b/bin/glnxa64/libtiff.so.5: no version information available (required by /usr/lib/liblept.so.5) 3 >> tesseract: symbol lookup error: tesseract: undefined symbol: _Z

浏览 0提问于2017-01-17得票数 0

1回答

如何在安装后获得python包的完整路径

、、

所以我是编程的初学者。我正在尝试将jpeg文件转换为文本文件，但无法这样做。我收到了一个错误 try: from PIL import Image except ImportError: import Image import pytesseract print(pytesseract.image_to_string(Image.open('A_1.jpg'))) 我查看了文档并找到了错误存在的原因，并找到了解决方案： 'If you don't have tesseract executable in your PATH, include th

浏览 8提问于2021-09-23得票数 0

回答已采纳

3回答

pip3安装tesserocr出现错误

、、、

我正在尝试在Ubuntu上安装python3.6的tesserocr包。当我运行pip3 install tesserocr时，我得到这个错误： Running setup.py bdist_wheel for tesserocr ... error Complete output from command /usr/bin/python3 -u -c "import setuptools, tokenize;__file__='/tmp/pip-build-cmhownuf/tesserocr/setup.py';f=getattr(tokenize, '

浏览 1提问于2018-05-11得票数 1

2回答

与linux命令对应的Windows CMD命令

、、、

wget http://tesseract-ocr.googlecode.com/files/tesseract-3.00.tar.gz tar -zxvf tesseract-3.00.tar.gz rm -f tesseract-3.00.tar.gz git clone https://android.googlesource.com/platform/external/jpeg libjpeg git checkout e0eadaa39b72e33f032220246c771d7302ebeaf8 cd .. export TESSERACT_PATH=${PWD}/tesserac

浏览 2提问于2011-04-19得票数 2

回答已采纳

1回答

用于linux UnsatisfiedLinkError的tess4j

、、、

我正在使用tess4J应用程序接口来处理光学字符识别过程。我已经成功地在windows上部署了我的项目，但是我被困在linux ubunutu上运行这个项目。根据我的研究，我必须在linux上使用.so文件而不是.dll文件。我的简单代码片段看起来像belove import net.sourceforge.tess4j.Tesseract; import net.sourceforge.tess4j.TesseractException; import net.sourceforge.tess4j.util.PdfUtilities; private static Tesseract in

浏览 0提问于2015-02-17得票数 2

1回答

Pytesseract在Windows和Linux中的行为不同

、、、、

我正在尝试使用Pytesseract来进行一些非常基本的字符识别。当我在Linux中运行以下代码时，输出是有意义的： import matplotlib.pyplot as plt import pandas as pd import sys import pytesseract # need to add tesseract install location to path in windows. if sys.platform == 'win32': tesseract_path = r"C:\Program Files\Tesseract-OCR\tes

浏览 0提问于2019-05-23得票数 0

1回答

CMake为Tesseract和OpenCV

、、、、

我对Linux编程很陌生，我正在尝试使用Ubuntu 12.10和在上创建一个OCR应用程序。到目前为止，我已经在linux上安装了tesseract和OpenCV，我也遵循了这个，在本教程中，我发现很容易在其中创建一个文件CMakeList.txt并链接OpenCV。现在，我正在尝试用tesseract-ocr编译库。正如我所知，我没有在tesseract-ocr和我的代码之间建立链接，这就是为什么我有错误的原因。我想要的和搜索的是，如果可能的话，我是否可以在一个文件中使用Tesseract和OpenCV链接CMake。一个教程将是很好的，因为我是全新的Linux。提前感谢

浏览 4提问于2013-12-04得票数 3

回答已采纳

1回答

pip安装tesserocr失败，错误为“为tesserocr建造失败的车轮”

、、、、

我已经有了最新的轻子子和tesseract的版本。 tesseract 4.00.00alpha-365-gcf0b378轻子-1.74.1 libjpeg 8d (libjpeg-turbo 1.3.0)：libpng 1.2.50 : libtiff 4.0.3 : zlib 1.2.8 我还安装了所有依赖项，如python-dev。这是我在虚拟服务器中安装pip时所遇到的错误 Collecting tesserocr Using cached tesserocr-2.1.3.tar.gz Building wheels for collected p

浏览 2提问于2017-04-10得票数 6

回答已采纳

1回答

无法在Linux上使用Java的Tesseract OCR

、、、、

我在服务器上部署了一个war文件，Java在后端工作。我试图让Tesseract在CentOS上使用Java，但它根本无法工作。不过，它在我的Windows本地主机上运行得很好。我的代码是： private void doOCR(File file) // The image file { InputStream stream = new FileInputStream(file); ContentHandler handler = new BodyContentHandler(); Metadata metadata = new Metadata(); Pa

浏览 6提问于2015-07-22得票数 0

1回答

tesseract-orc连简单的图像都不读文本

、、

为了让其他人在Google上发现这一点，我会详细解释我的问题，尽管这应该是显而易见的。我正在使用tesseract-ocr，希望从图像中删除文本。我正在努力解决的问题是，即使是在最简单的图像中，tesseract-orc也找不到文本。请参阅下面的系统和版本信息： [root@tower python2]# uname -a Linux tower.youds.com 2.6.32-504.12.2.el6.x86_64 #1 SMP Wed Mar 11 22:03:14 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux [root@tower python2]#

浏览 1提问于2015-04-20得票数 1

回答已采纳

1回答

Tesseract-OCR :在linux环境下spring web应用程序中使用Tess4j

、、、、

我正在尝试使用tomcat 7服务器在linux环境(Linuxmint-ubuntu14.04)上的spring应用程序中使用tesseract-ocr。但我得到了一个错误，因为： java.lang.UnsatisfiedLinkError: Unable to load library 'tesseract': libtesseract.so: cannot open shared object file: No such file or directory com.sun.jna.NativeLibrary.loadLibrary(NativeLibrary.java:

浏览 10提问于2014-11-28得票数 1

回答已采纳

1回答

用python将图像转换为txt

我有这个.py文件，它应该将图像转换成字符串。 img2str.py： from PIL import Image from pytesseract import image_to_string image = Image.open('image.png', mode='r') print(image_to_string(image)) 我试过： python3 img2str.py 我得到了： Traceback (most recent call last): File "/home/linux/.local/lib/python3.6/sit

浏览 2提问于2019-09-23得票数 0

回答已采纳

1回答

combine_tessdata:找不到命令

、、

我已经安装了tesseract (linux )，并使用tesseract -v命令获得了 tesseract 3.03 leptonica-1.70 libgif 4.1.6(?) : libjpeg 8d : libpng 1.2.50 : libtiff 4.0.3 : zlib 1.2.8 : webp 0.4.0 但是，当我运行以下命令时 combine_tessdata -u /usr/share/tesseract-ocr/tessdata/tur.traineddata /home/hp/tur. 我明白了。 combine_tessdata:找不到命令运行co

浏览 5提问于2015-06-02得票数 3

回答已采纳

2回答

使用Android NDK构建Tesseract

、

我正在按照教程为Android编译Tesseract的分支(一个光学字符识别包)。我正在使用Cygwin为Tesseract Android项目构建NDK。在调用ndk-build (从tess-two目录)时，我得到了以下错误： c:/android-ndk-r8b-windows/android-ndk-r8b/toolchains/arm-linux-androideabi-4.6/prebuilt/windows/bin/../lib/gcc/arm-linux-androideabi/4.6.x-google/../../../../arm-linux-androideabi/bin

浏览 3提问于2012-09-18得票数 3

回答已采纳

1回答

TessBaseAPICreate : UnsatisfiedLinkError -未定义符号:Tesseract

、、

当我尝试运行时，我得到了以下错误。 Exception in thread "main" java.lang.UnsatisfiedLinkError: Error looking up function 'TessBaseAPICreate': /usr/local/lib/libtesseract.so: undefined symbol: TessBaseAPICreate at com.sun.jna.Function.<init>(Function.java:179) at com.sun.jna.NativeLibrary

浏览 1提问于2012-10-29得票数 2

19回答

Tesseract运行错误

、

我在linux上运行tesseract-ocr引擎时遇到了问题。我下载了RUS语言数据并将其放到tessdata目录(/usr/local/share/tessdata)。当我试图使用命令tesseract blob.jpg out -l rus运行tesseract时，它会显示一个错误： Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent director

浏览 3提问于2013-02-10得票数 114

2回答

安装用于AWS linux的Tesseract

、、、、

如何在AWS Linux中安装Tesseract？几个月前，我们的一位团队成员尝试了以下命令。 cd /opt mkdir tesseract chmod 0755 tesseract cd tesseract yum install libpng-devel yum install libtiff-devel yum install libjpeg-devel wget http://www.leptonica.com/source/leptonica-1.71.tar.gz tar xzf leptonica-1.71.tar.gz cd leptonica-1.71 ./config

浏览 7提问于2020-04-14得票数 6

2回答

Ubuntu18.04错误安装tesseract

、、

我安装了Ubuntu 18.04。我使用sudo apt-get install tesseract-ocr安装了tesseract 当我打字时： tesseract -v 我犯了一个错误 tesseract: symbol lookup error: /usr/lib/x86_64-linux-gnu/libtesseract.so.4: undefined symbol: pixaDisplayTiledInColumns 下面是apt-cache policy tesseract-ocr的输出： Installed: 4.00~git2288-10f4998a-2 Candidate:

浏览 0提问于2019-01-11得票数 1

回答已采纳

1回答

对于64位Windows操作系统和32位Ubuntu操作系统，Tesseract解码结果不同

、、、

我正在测试相同的图像附加到解码数字使用tesseract。我在64位Windows操作系统和32位Ubuntu操作系统上进行了测试。Windows操作系统中的测试结果给出了正确的结果。Windows的结果是43750，但是32位的Ubuntu给了我43730。我使用的代码如下所示 tesseract::TessBaseAPI tess; tess.Init("/usr/share/tesseract-ocr/tessdata/", "eng", tesseract::OEM_DEFAULT); tess.SetVa

浏览 1提问于2015-07-06得票数 0

回答已采纳

4回答

如何在Ubuntu/Linux发行版中安装Tesseract-OCR 3.03？

、、、

我和一位朋友有兴趣为一个CV项目培训tesseract-OCR引擎。我们尝试使用一些包装器，如PyTesser和pyocr，但目前的结果并不像我们需要的那样准确。因此，我们希望尝试训练tesseract以更好地执行我们的目的(即识别食品标签上的文本)，但在安装训练工具时遇到了一些问题。我们尝试过的内容：在谷歌代码网站上，说培训工具只在3.03版本中可用。然而，tesseract-ocr的谷歌代码“下载”页面上只有3.02版本的资料。“编译”页面的底部也有一些关于在Windows和OSX上安装3.03版本的评论，但还没有针对Linux用户的评论。似乎也有一些，但我们不确定如何在我们的计算机

浏览 0提问于2014-06-14得票数 13

1回答

tesseract / tesserocr / leptonica包在Python应用程序中失败，而部署在Bluemix上

、、、

我正在尝试部署一个用于图像识别的Python应用程序，该应用程序使用tesseract，tesserocr和leptonica。但是，在Bluemix上部署它时，我得到了以下错误。 Complete output from command /app/.heroku/python/bin/python -u -c "import setuptools, tokenize;__file__='/tmp/pip-build-0jQxGj/tesserocr/setup.py';f=getattr(tokenize, 'open', open)(__file__

浏览 3提问于2017-10-30得票数 0

1回答

Tesseract红帽猫8配置- TessApi类缺陷

、、、、

Tesseract在eclipse、windows 7、Tomcat 8中成功运行当我在linux (RHEL)+java 8+tomcat 8上运行相同的应用程序时，我会得到类缺陷错误。类在“类”文件夹中(TessAPI.class)。我这样做是为了在linux中安装。 tar xzf tomcat8.0.37.tar.gz sudo yum install libpng-devel libjpeg-devel sudo yum install libtiff sudo yum install automake sudo yum install libtool yum install

浏览 3提问于2016-10-07得票数 1

回答已采纳

1回答

错误net.sourceforge.tess4j.Tesseract -无法加载库'gs'：在资源路径中找不到本机库(linux-x86-64/libgs.so)

、、

<code>A0</code> 我在maven中使用了上面的依赖项。这是在java和eclipse中使用的。我现在正在编译成一个可执行的jar，它在windows中执行时没有任何错误，因为我已经在windows中安装了'Visual C++ Redistributable Packages for Visual Studio2013‘。但是现在我想在linux机器上运行可执行jar。我得到以下错误：错误net.sourceforge.tess4j.Tesseract -无法加载库'gs'：在资源路径(file:/MedEq/OCR/dme-

浏览 219提问于2018-12-21得票数 0

1回答

Tesseract + OpenCV + linux

、、、、

我已经用OpenCV和Tesseract在Windows上开发了一个OCR应用程序。现在我要做的就是用C++在Linux (Ubuntu12.10)上编写同样的应用程序。我在Linux开发方面没有任何经验。我不知道从哪里开始。我所需要的只是开发环境，在这个环境中，我可以将这两个库OpenCV和Tesseract连接起来。请给我建议。我试过搜索谷歌，但失败了。也许我没有用好的关键词搜索。因为我在Linux中是全新的

浏览 1提问于2013-11-28得票数 0

回答已采纳

2回答

在python中使用tesseract 4

、、、

我已经在python和pytesseract(来自Pypi)中使用了tesseract 3.04，现在我想使用基于4.00.00alpha的新LSTM 我使用的是kali linux，所以我安装了libtesserct4(使用apt-get)，它在tesseract-ocr中创建了名为4.00的文件夹，但当我尝试将它与pytesseract一起使用时，它无法识别--eom input 代码是： pytesseract.image_to_string(Image.open(filename),lang="en",config='--eom 2') 结果： read

浏览 2提问于2017-12-26得票数 2

1回答

编译tesseract时出错

、、、、

我正在通过使用android r8b编译 ( tesseract -android- tools包含用于编译tesseract OCR、Leptonica和库的android工具)。自述文件说明说，这三个库将放在项目文件夹下的“外部”文件夹下(这里是"tesseract-android-tools-1.00“文件夹)。那么文件夹结构将是： tesseract-android-tools-1.00/external/libjpeg/ tesseract-android-tools-1.00/external/tesseract-3.00/ tesseract-android-tools

浏览 1提问于2012-09-15得票数 1

回答已采纳

1回答

当使用--tessdata-dir参数时，如何解决初始化错误1 (read_params_file:参数未找到: II*)？

、、、

环境&安装操作系统: Suse Linux企业服务器12 SP 1 $ uname –a Linux 3.12.62-60.64.8-default #1 SMP Tue Oct 18 12:21:38 UTC 2016 (42e0a66) x86_64 x86_64 x86_64 GNU/Linux 由于这个环境是管理的，所以我不能更新像glibc等任何系统库。因此，我发现的teaaseract的"Suse 12 SP1 x86_64“官方支持的最新版本是3.02。已安装的软件包： libgif4-4.1.6-34.1.1.x86_64.rpm liblept3-1.69

浏览 4提问于2017-01-01得票数 1

回答已采纳

2回答

Windows环境下的tesseract培训

我正试图使用友好提供的二进制文件，在Windows 7上为一种新的语言培训tesseract。我正在遵循中描述的培训过程。text2image的工作效率很高，可以生成文件。但是，当我运行tesseract ... box.train时，我会得到以下错误： read_params_file: Can't open box.train 二进制文件缺少什么吗？是否可以在Windows上培训tesseract，还是应该改用Linux？

浏览 3提问于2016-10-30得票数 0

回答已采纳

1回答

在Ubuntu中成功地安装了tesseract_ocr之后，它没有显示出名为tesseract_ocr的mudule。

、、、

我通过Linux终端安装了Tesseract OCR，但是当我尝试用Python导入它时，出现了以下错误： /usr/bin/python2.7 /home/web/Documents/pnt/cre.pyTraceback(最近一次调用)：File“/home/web/Documents/pnt/cre.py”，第1行，inimport tesseractImportError:无名为tesseract的模块

浏览 1提问于2015-06-24得票数 0

1回答

独立包在ec2上工作，而不是在lambda上工作

、

我想在lambda上部署tesseract-OCR。滚动到其中显示为tesseract 4的适配的部分。我已经按照本教程构建了tesseract。但我正面临着一个问题，因为构建是不可移植的。每当我尝试使用在新的Linux实例上构建的时，我必须将环境变量PATH设置为/tmp，否则这将不起作用。结构 ├── cv2 ├── lib ├── numpy ├── PIL ├── pytesseract ├── tessdata ├── tesseract ├── test.png └── zzz.py 这是独立tesseract的链接。有一个示例程序zzz.py，其中包含用于运行tessera

浏览 0提问于2018-09-27得票数 1

1回答

文本块内的tesseract整数识别

、、、、

我对tesseract和openCV都是新手。我正在构建一个简单的Linux应用程序，用于在纸上口述打印文本。使用tesseract，我成功地进行了文本块识别，但是，如果文本块中有一个整数，则该数字将被省略。示例输入："Hello this is my 3D video in 2014 is 1080p“输出："Hello this is my 3D video in that is 1080p” 以前有没有人遇到过这个问题？ openCV :2.4.9 Tesseract:V3.02 Leptonica: 1.71操作系统: Ubuntu 64位14.04 LTS 问候

浏览 0提问于2015-01-12得票数 2

1回答

程序'tesseract‘无法执行或在您的系统路径上找不到- Laravel

、、

我使用"pyinstaller“创建了一个可执行文件。它在Ubuntu的终端上运行良好。但是，当我使用Symfony进程在Laravel web应用程序中运行可执行文件时，在控制台中看到以下错误-> The program 'tesseract' could not be executed or was not found on your system PATH. [11805] Failed to execute script 'converttotext' due to unhandled exception! Traceback (most

浏览 61提问于2021-07-22得票数 0

1回答

tesseract没有拿到小标签

、

我已经在linux环境中安装了tesseract。当我执行类似的操作时，它会工作。 # tesseract myPic.jpg /output 但是我的照片上有一些小标签，但没有看到。是否有一个选项可以设置一个音高之类的东西？文本标签示例：有了这张照片，tesseract不认识任何价值..。但有了这张照片：我有以下输出： J8 J7A-J7B P7 \ 2 40 50 0 180 190 200 P1 P2 7 110 110 \ l 例如，在本例中，tesseract看不到90 (左上角). 我认为这只是一个定义或者类似想法的选择，不是吗？ Thx

浏览 2提问于2016-09-28得票数 12

回答已采纳

1回答

Windows 10上的R Tesseract错误:错误的JPEG库版本:库为90，调用者期望为80

、、

我试图在R中使用Tesseract从图像中刮取数据，但是我得到了一个错误。这是我正在使用的代码和错误： library(tesseract) eng <- tesseract("eng") text <- tesseract::ocr("https://cdn.who.int/media/images/default-source/emergencies/disease-outbreak-news/table19f24bf8a-7733-400f-abaa-150c481f876a.jpg", engine = eng) Wrong JPEG l

浏览 8提问于2022-07-01得票数 2

回答已采纳

1回答

Linux上的Tesseract撞毁了玻璃鱼

、、、

我们正在使用Tess4J/Tesseract在webapp上执行OCR。在Windows上运行良好，但是当部署在Linux机器上时，程序会崩溃，杀死glassfish进程并输出一个转储文件：hs_err_pidXXXXX.log。 # # A fatal error has been detected by the Java Runtime Environment: # # SIGSEGV (0xb) at pc=0x00007f9fdd5322a0, pid=10412, tid=140324597778176 # # JRE version: Java(TM) SE Runtime En

浏览 0提问于2015-02-20得票数 1

回答已采纳

1回答

在Linux下运行tess4j (tessreact包装器)

、、、

在linux服务器上正确安装了tesseract 3.0.2库： [root@XXX as]# rpm -qa | grep ".*tess.*" tesseract-3.02-alt1.r723 在尝试运行tess4j包装器时，得到了以下异常： Exception in thread "main" java.lang.UnsatisfiedLinkError: Error looking up function 'TessBaseAPICreate': /usr/lib64/libtesseract.so.3.0.2: undefined sy

浏览 1提问于2014-08-20得票数 0

回答已采纳

1回答

如何将终端中的文本保存为各种文本格式？

、

我正在玩一些OCR软件，特别是我花了一点时间在tesseract上。在Linux终端中，我把它放到可以加载图像并获得tesseract从图像中提取文本的位置。我现在正试图弄清楚如何从终端自动将被撕破的文本保存到pdf、odf、txt和word格式。

浏览 0提问于2021-03-08得票数 0

回答已采纳

5回答

linux中的libtesseract.so错误“无法加载库‘' tesseract '：libtesseract.so’

、、

我在eclipse中使用tess4J ocr库，并且在我的窗口中工作得很好。但是，当我想在linux中运行那个java程序时，它会出现一个错误：“无法加载库'tesseract'：libtesseract.so:无法打开共享对象文件:没有这样的文件或目录”。我在linux上没有安装tesseract或任何其他软件的任何权限。只是我可以使用jar文件并通过调用shell script.Please来运行java程序。正如我所想的那样，我的问题将通过获取libtesseract.so文件或帮助我如何在windows中获得libtesseract.so来解决，这样我就可以在linu

浏览 4提问于2013-08-24得票数 3

回答已采纳

1回答

pytesseract.pytesseract.TesseractNotFoundError: tesseract没有安装，或者不在您的路径中。有关更多信息，请参见自述文件

、、

import pytesseract from PIL import Image img = Image.open('image1.jpg') result = pytesseract.image_to_string(img) print(result) 我的问题可能类似于和。但是，对我来说没有什么有用的答案. 错误：回溯(最近一次调用)：文件"/home/istiak/PycharmProjects/image-to-text/venv/lib64/python3.9/site-packages/pytesseract/pytesseract.py"

浏览 5提问于2021-03-16得票数 2

1回答

在Linux中构建可移植的Tesseract OCR库

、、、、

有没有一种方法可以像在Windows中那样构建和使用Tesseract库和相应的Leptonica库(因为Tesseract依赖于Leptonica)？我根据这些库的说明编译了这些库，但是libtesseract.so.3.0.2似乎包含了一个指向Leptonica共享库的固定路径： $ ldd libtesseract.so.3.0.2 linux-vdso.so.1 => (0x00007fffbc5ff000) **liblept.so.4 => /usr/local/lib/liblept.so.4 (0x00007fa8400fd000)** libpng12.so

浏览 1提问于2015-06-04得票数 4

回答已采纳

1回答

Android手写识别库

、、、、

我目前在Android中使用tess-two库进行OCR，它根据输入图像和训练数据给我们一个结果。我想要做的是基于以前的手写数据建立我自己的训练数据。我研究了如何使用tesseract：在Linux系统上训练数据。 tesseract支持在android上做这样的事情吗？还有没有其他库提供这样的功能？

浏览 1提问于2014-03-05得票数 3

2回答

Tesseract使用字母子集

、、、、

我在Ubuntu Linux上使用tesseract-ocr包，我已经使用了一段时间了，我认为为了提高OCR的准确性，我只需要字母表中的一个子集。我需要的字母是： 0123456789abcdefghijklmnopqrstuvwxyz 只有这样，即使是大写字母，有人能帮我指出tesseract只与字母的子集匹配吗？谢谢,

浏览 0提问于2013-03-20得票数 1

回答已采纳

1回答

通过子进程python调用tesseract时，不会显示任何输出

、、

我正在尝试使用子进程从python内部的tesseract中读取验证码，但它给出了乱七八糟的输出 p = subprocess.Popen(['tesseract', 'CAPT1.png','stdout','-l','eng','--oem 3','--psm 7','>>','nm.txt'], stdout=subprocess.PIPE) p.communicate() Out : (b' \n\x0c', Non

浏览 1提问于2020-03-16得票数 0

1回答

本机库(Linux86-64/libtesseract.so)在资源路径中找不到

、、

我有RHEL7.3 7.3，我在其中建造了tesseract，我能够执行我的jar。现在，我有了另一个具有相同RHEL配置的系统，我想要执行相同的jar，但是我不想在这个系统上构建tesseract，所以我选择/usr/lib64 64/libtesseract.so和/usr/lib64 64/liblept.so，从以前构建的tesseract系统中，将这些这样的文件放在/usr/lib64 64/ path的新RHEL7.3系统中，并尝试执行jar，但是这次我的jar没有成功地执行'java.lang.UnsatisfiedLinkError：，无法加载库'tessera

浏览 10提问于2017-06-21得票数 2

1回答

加速tessearct

、、、

我一直在linux上使用tesseract (Ver3)从扫描的pdf文件中提取文本。问题是整个过程很慢，非常慢。例如，提取这个() 20页文档需要514秒(8+分钟) 为了转换pdf，我使用了Image Magick转换应用程序。下面是我使用的set命令。转换-density 288 src.pdf -colorspace灰度-depth 8 -alpha off tmp.tif tesseract tmp.tif out.txt 请注意，288dpi是必需的，否则tesseract将无法从我测试的扫描文件中提取文本。有没有人知道如何在不影响结果质量的情况下提高速度？

浏览 1提问于2011-05-02得票数 1