我需要用图像识别解决方案标记一个给定的图像,然后根据另一个参数浏览结果。例如,我可能传递某个城市的市政厅的照片,该算法将返回标识可能的大厅的标签,例如Bologna City Hall、Modena City Hall、ecc.,然后,基于另一个参数,位置,它将给我正确的标签,就像参数是Modena,选择Modena City Hall作为正确的解决方案一样。
在性能非常重要的情况下,您将如何构建此结构?
有一个巨大的模型训练了所有的照片,然后根据结果浏览?
每个城市都有不同的模型,并根据参数选择正确的模型?
我也和我的教授谈过这个问题,他对我说要建立一个图像识别模型,它也把参数作为输入,这样