项目:基于内容的图像检索-半监督(在训练时对图像进行手动标记)
描述
我的数据库里有1000000张图片。训练是手动的(有监督的)-为每个图像提供标题和标签。示例: coke.jpg标题:可口可乐标签:可口可乐,罐头
使用图像和标签,我必须训练系统。训练后,当我给出一个新的图像(已经在数据库中/完全新的)时,系统应该输出图像可能属于的标签,并显示属于每个标签的少量图像。系统也可能会说找不到匹配项。
问题:
1)什么是图像指纹?预期的图像指纹大小是多少?(这一点很重要,因为数据库中将插入数百万张图像)
2)该指纹在数据库中的字段格式是什么?(这一点很重要,因为…需要快速搜索脚本应在不到1秒的时间内在1M图像数据库中搜索)
3)我们用来分析它们的描述符(算法)是什么?
提前感谢
发布于 2012-12-29 19:59:26
这个主题很大,但这里是一个可能的解决方案的简要概述
以下是一些帮助您入门的文章:
Mikulík, Andrej, et al. "Learning a fine vocabulary." Computer Vision–ECCV 2010 (2010): 1-14.
发布于 2012-12-10 09:58:37
我建议根据从训练图像中提取的图像特征列表来训练SVM模型
发布于 2012-11-22 17:04:05
https://stackoverflow.com/questions/13507556
复制