例如:有一张图片,我在图片中有一篇文章。以及如何将该文章转换为字符串?你能告诉我或者给我一个解决方案吗?
发布于 2013-01-10 08:22:08
你需要一个Optical Character Reader。谷歌有一个Tesseract.NET,它应该给你一个.NET的光学字符识别。
但是请注意,OCR有其局限性。字体和字号不同的文本可能会导致OCR产生不正确的结果。
预处理通常是有帮助的,例如,如果你的文本总是在图像的某一段内,你可以只将该子部分输入到OCR中。去除颜色通常也是一个好主意。
发布于 2013-01-10 08:21:14
您正在寻找的是极有可能的光学字符识别(OCR),它将允许您将图像中的字符转换为其文本表示形式。
似乎解决C#问题的最常见方法是使用Tessnet,这是一个围绕谷歌原生Tesseract OCR库的.NET包装器。
有关更多信息,您可以随时参考以下相关问题:
OCR with the Tesseract interface
https://stackoverflow.com/questions/744966/any-open-source-c-sharp-ocr-library
https://stackoverflow.com/questions/14253444
复制