要过年了,节前比较忙一直没有时间来发文章,今年忙里偷个闲,给大家讲一讲我最近在看的光学字符识别开源项目Tesseract-OCR。
Tessercat是一个开源的光学字符识别引擎也就是大家所说的ocr(Optical Character Recognition),Tessercat最早是HP公司的实验室开发的由google维护的,现在整个库已经支持了全球60多种语言文字,其中也包括中文。
tessercat依赖两个模块 模块 pil + tessercat-ocr
安装pil 命令行 pip install pillow
安装 tesseract-ocr 命令行 pip install pytessercat
安装完成后需将tessercat路径加入到系统的PATH中
再没有安装中文语言库时,我们可以测试些简单的数字如使用画图随便画一些数字或者屏幕截图一些数字
随便画一画
通过命令行找到Tessercat的安装目录,如果已将Tessercat安装路径加入到系统的PATH中可省去这步直接输入命令:
tessercat.py number.jpg result -l eng
命令完成后开发Tessercat的安装目录下面可以找到Tessercat自动新建的result.txt的文件,打开以后可以看到结果为0642316857,整个识别率还是很高的,想要提高识别率的话需要自己训练,生成自己需要的识别语言库。
领取专属 10元无门槛券
私享最新 技术干货