在Linux使用了3.4.8的版本报乱码, 换新版本试试, 新版本 411的也一样的问题
一堆问题, 跑通了得到的文字也是乱的, 没有的文字乱七八糟的文字都出来了, 但是使用原生的 Tesseract...命令行解析出来的文字就还可以, 一直处在奔溃的边缘,但是没有放弃, 看到了一个easyocr的项目
https://github.com/ushelp/EasyOCR
不过此项目已经找不到开源的代码了,...// 中文识别修正
ocr.setLanguage(Language.CHI_SIM); // 中文语言
String res=ocr.discern("images/bank/notice.tif"...中文识别
ocr.setTextMode(TextMode.UNIFORM_TEXT); // 统一大小
List res3=ocr.discernByTemplate("images/...);
System.out.println(res4);
经过上面的分析,开始写代码,直接调用命令, 这个命令的调用, windows机器,Linux机器分别安装最新版本的Tesseract并且确保在命令行里面能直接使用命令