前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python获取图片中的文字

python获取图片中的文字

作者头像
懿曲折扇情
发布2023-09-05 15:21:06
6090
发布2023-09-05 15:21:06
举报
文章被收录于专栏:建帅技术分享

一、背景

项目中使用中python识别图片中的文字,所以就有了下文

二、依赖环境

1.安装tesseract(我选择了最新的包)

安装包地址: https://digi.bib.uni-mannheim.de/tesseract/

注意:记住安装路径后面会配置环境变量用到

2.安装中文语言包

安装包地址: https://tesseract-ocr.github.io/tessdoc/Data-Files

3.配置环境变量

添加用户变量:TESSDATA_PREFIX

添加环境变量

4.测试是否安装成功

终端执行tesseract -v

5.执行代码

代码语言:javascript
复制
# coding=utf-8
"""
    @project: automation_tools
    @Author:gaojs
    @file: test043.py
    @date:2023/7/17 15:07
    @blogs: https://www.gaojs.com.cn
"""
import pytesseract
from PIL import Image


def get_text_from_photo(photo_path):
    """
    从图片中获取文字
    """
    # 读取图片
    im = Image.open(photo_path)
    # 识别文字,并指定语言
    text = pytesseract.image_to_string(im, lang='chi_sim')
    print(text)
    return text


if __name__ == '__main__':
    get_text_from_photo(photo_path='test043.png')

6.错误提示

代码语言:javascript
复制
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

7.解决报错

代码语言:javascript
复制
在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract',修改成 tesseract_cmd =r'D:\OCR\tesseract.exe'

8.成功运行

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-07-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、背景
  • 二、依赖环境
    • 1.安装tesseract(我选择了最新的包)
      • 2.安装中文语言包
        • 3.配置环境变量
          • 4.测试是否安装成功
            • 5.执行代码
              • 6.错误提示
                • 7.解决报错
                  • 8.成功运行
                  相关产品与服务
                  腾讯云服务器利旧
                  云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档