= 'test.png'
img = Image.open(img_str)a = pytesseract.image_to_string(img)
for w in a.split('\n'): #格式化输出...if w.strip():
print(w)
好吧,第一版的程序,只能正确的解析图中的英文和数字“idw007”,对中文的解析,只能让人呵呵呵;但是不能灰心,...如下:调整了图片背景,字体;准确率只有53.92%,还不如人工一个个手动翻译了
4,我们处理图像-提高字的识别度
这里简单的使用PIL中的图像处理方法,将红色的阈值替换为白色,从而消除红色网格背景线的干扰...data = np.array(im)
print(data) # RGBA 数据矩阵
r1,g1, b1 = [220, 58, 21]
rw, gw, bw...mask = ((red <= r1) & (green <= g1) & (blue == b1))
data[:, :, :4][mask] = [rw, gw, bw