我最终通过使用google cloud vision API (OCR)成功地获取了名片内容。我的问题是,我将所有内容都存储在一个TextView中,如何从其中获取姓名和电话号码以及电子邮件?有没有办法从字符串中获取我想要的最重要的细节?提前谢谢。
发布于 2020-11-04 00:01:15
我知道您想使用Google Cloud Vision API从卡中提取和识别某些数据。
您可以通过OCR获取数据,但问题在于如何识别这些数据,因为卡片有无限数量的样式和结构。
正如@Inga在评论中提到的,你可以尝试使用正则表达式,尽管你想要考虑的样式和结构越多,这可能会变得越困难。
因此,我还建议您考虑使用机器学习方法。
例如,看看这篇关于Parsing Structured Documents with Custom Entity Extraction的文章。它使用Google Cloud Vision API读取数据,与您一样;但随后它使用Google Cloud Natural Language API通过实体提取来识别某些元素。
看一下Natural Language Entity's description,看看您可以识别此功能的哪种元素,例如姓名、电话号码和地址。
同样,如果此功能与您需要识别的所有数据都不匹配,您还可以考虑为要提取的特定数据类型选择creating and training a custom AutoML Natural Language model。前面提到的文章还利用这一点来识别餐厅菜单中的特定数据。
您也可以考虑看看Google Cloud Document AI,它也提供了面向文档分析的光学字符识别特性。
https://stackoverflow.com/questions/64621684
复制相似问题