有没有什么好的方法来检测图像中是否包含文本?
我不是在寻找一种检索文本的方法,只是检测图像中是否存在一个或多个字符。
我可以理解,没有万无一失的方法来检测文本,比如当字体有点不标准时;它可能很难识别。我在寻找一个“尽可能好”的解决方案。
请看下面图片中的文本示例:
发布于 2014-08-16 00:22:29
检测是否存在文本与提取文本几乎相同,即,如果您能够提取文本,它将确认存在文本。检测文本的步骤与提取文本的步骤大致相同,最后的10%是对OCR中的特定语言和文本类型进行了一些优化,以产生更好的文本识别。大多数繁重的工作都发生在过程的开始,特别是图像二值化和背景去除、分割成对象、用于布局的文档分析、对象类型检测以及单独识别每个对象。
有关背景信息,请看我几个月前写的一篇博客文章,内容是通过光学字符识别从复杂的图片和图像中检测和提取各种文本:http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers
对于给定的图像,一个接一个地执行这些步骤,您将能够决定今天的技术是否可以在这些图片中看到文本,以及任何其他图片。
此外,OCR软件的质量将决定每一步能起多大作用。功能更强大的OCR将能够成功处理更复杂的图像。例如,在过去使用Tesseract时,它通常不返回任何指示图像上没有文本的内容。其他一些商业OCR能够从相同的小图片或非常低质量的图片中返回文本,表明存在文本。本质上,两个实体告诉你不同的事情,你需要知道哪个更明智,并倾听那个。
此外,一些OCR将有特殊的模式来“积极”的文本提取,这将甚至进入徽标和图表,以便找到和提取每一块文本,以及任何看起来像文本的东西。其他OCR可能只是将相同的徽标视为图片,即使其中包含文本,但该文本不会变成字符。想想微软或谷歌的徽标吧。我知道有两个商业产品具有从其他对象中进行高级文本提取的功能:ABBYY FlexiCapture高级企业数据捕获软件和OCR-IT Cloud OCR API,它具有TextAgressive分析和提取模式。
使用上面的方法,让我们看一下提供的每个示例:
Donald -一些字符可以被检测到,机会很低
Vip主页-无法检测到字符
Smoothdealer字符可以通过15度旋转测试来检测
Oneplus -可以检测字符。大多数OCR软件都支持倒排文本。
500PCS -可轻松检测字符
发布于 2014-08-13 15:18:24
您可以使用OpenCV和Template matching来检测文本。我认为这将是类似于人脸检测算法的算法。
https://stackoverflow.com/questions/25280169
复制相似问题