截图上的tesseract OCR给出了相当不稳定的结果。即使图像完全是黑色的,上面覆盖着白色文本,似乎也只有部分文本被正确识别。即使在我将图像调整为300dpi之后,准确率仍然很低,并且大多数文本都是胡言乱语。 我在StackOverflow上看到了类似的问题:Best way to recognize characters in screenshot? 如前所述,问题的作者能够通过用他的字体训练tesseract引擎来获得几乎100%的准确率。 我的图像中的字体是Arial。我怎样才能提高准确率呢? 这是我拥有的一种图片的示例:Image Sample
我跟踪是为了使用GlassVoice.apk脱机实现语音识别器。
我在此实现了一个类似的解决方案:
String[] items = {"The cat", "The dog", "The lion", "The next step"};
mVoiceConfig = new VoiceConfig("MyVoiceConfig", items);
mVoiceInputHelper = new VoiceInputHelper(this, new MyVoiceListener(mVoic