我目前正在进行一个项目,在这个项目中,我需要检测到多字体图像上的粗体文本(因此数学形态学是不可能的)。此检测将与OCR系统(与tesseract)并行使用,以检测文档中哪些信息(粗体)是重要的。
我已经测试了tesseract的wordFontAttribute()函数,但是它是不一致的:它提供了粗体检测的糟糕结果,降低了我的OCR系统的性能,因为要使用这个函数,需要一个旧版本的tesseract (v3)。
我发现了一些基于字体风格检测的科学研究,比如大胆的检测(谷歌学者的“文档图像中意大利语、大写词和全大写词的自动检测”和"多字体文档中Bold词的独立脚本检测“)。
我想知道是否有一个代码实现的这项研究在线。
任何其他关于大胆探测的想法也是值得欢迎的。
发布于 2022-07-11 06:26:34
粗体文本检测没有全局解决方案,这取决于文档。我测试了大部分的文章,除了一篇基于每一个字符的笔画的文章,您可以在作者提到的“多字体文档中的Bold单词的脚本独立检测”中找到它。如果需要,我可以向您发送实现,但问题是没有提到作者所说的聚类方法(我使用了DBSCAN聚类算法)。
https://datascience.stackexchange.com/questions/107750
复制