因此,我正在开发一个简单的移动应用程序项目(主要是为了好玩),它使用Android上的OCR库(tesseract)扫描相机图片,对文本进行一些处理,并将其返回给用户。
我想知道的是,是否有人知道以编程(或统计)的方式来判断字符串是实际的单词,还是只是胡说八道。(我现在只针对英语,FYI)
例如,OCR可能会读取图片并返回。
String returned = "The quick brown fox."
或者,它可能会读另一张图片,然后返回。
String returned = "$. _- %/ hj @;+__~"
显然,返回的第一个字符串会产生单词,而第
下面是我测试Tesseract性能的非常简单的程序。我得到的结果并不像预期的那样,尽管这张照片质量很高,截图也很清晰(不是一张复杂的彩色图片)。请看我的代码和下面的结果。我不知道我是不是做错了什么事,或者说,魔兽世界的引擎不能处理这个问题?
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Drawing.Imaging;
using
我在网上找到了这段代码,一切正常,但我不知道如何获得执行中给定的输出值,这个脚本用于获取图像的文本,它确实给了我文本,但显示的内容类似于“图像的文本是...”我不知道是图片中的所有文字,还是遗漏了什么 我尝试过使用|Out- file“path of file”,但它显示的文本与上面提到的相同:/ 谢谢你的帮助! using namespace Windows.Storage
using namespace Windows.Graphics.Imaging
<#
.Synopsis
Runs Windows 10 OCR on an image.
.DESCRIPTION