本文已被CVPR2024收录
(上海交通大学,腾讯优图,复旦大学,荣旗工业科技,上海计算机软件技术开发中心)
Title:Real-IAD: A Real-World Multi-View Dataset for Benchmarking Versatile Industrial Anomaly Detection
Project Page:https://realiad4ad.github.io/Real-IAD/
动机:为什么构建Large-scale Real-world Real-IAD数据集
- 一方面,大多数最先进的方法在MVTec / VisA等主流数据集上已经达到饱和(AUROC超过99%),无法很好地区分方法之间的差异,且由于难度较小而与实际应用场景之间存在较大差距,因此需要更具挑战性的数据集来支持AD领域的进一步研究。
- 另一方面,各种新的实用异常检测设置的研究受到数据集规模的限制(比如带噪和小样本更贴近实际应用的setting),存在评估结果过拟合的风险,因此需要更大规模的数据集来支持;
- 工业生产中的良率通常介于60%-100%之间,与现有的100%良率实验setting不符,因此,需要更具实际应用价值的setting,即我们提出的Fully Unsupervised Industrial Anomaly Detection,FUIAD。
Real-IAD数据集特性:
- 更多的类别:30类真实产线物料
- 大规模数据量:150K数据
- 多种材料:金属,塑料,木材,陶瓷和混合材料
- 多种缺陷类别:缺失、划伤、裂纹、脏污、破洞、变形、凹坑、破损
- 多视角:5个拍摄角度(顶拍+4个侧拍)
- 更高的分辨率:2K~5K
- 支持多种实验设置:1)FUIAD;2)多视角AD;3)无监督AD;4)Zero-/Few-shot AD;5)带噪AD等
与主流的2D异常检测数据集规模及属性对比如下表
5个视角的采集效果图示例,包含两种典型异常场景:
1)缺陷可以在一个sample中的每个view都可见
2)缺陷仅在一个sample中部分view上可见
这更具有实际意义和更大的挑战性,将AD推向实际应用迈出了新的一步!
本文贡献
- 提出了一个新的Real-IAD数据集,它比现有的主流数据集大十倍以上。它包括30类对象,每类对象包含5个拍摄角度,共计150K高分辨率图像。Real-IAD具有更大的缺陷面积和缺陷比例范围,能够更好地区分不同方法的性能,满足IAD的各种研究设置。
- 基于Real-IAD数据集构建了一个更接近实际应用场景的FUIAD(Fully Unsupervised Industry Anomaly Detection)设置,其中仅使用大多数生产线的成品率大于60%的自然存在约束,而不引入额外的手动注释。
- 我们报告了常用的IAD方法在Real-IAD数据集上在几种设置下的性能,并提供了一个极具挑战性的基准,以促进异常检测领域的发展。
拆解 Real-IAD 数据收集的具体过程,如下图所示:
- 物料准备及缺陷产品构建
- 材料:包含金属,塑料,木材,陶瓷和混合材料
- 缺陷类型:包含缺失、划伤、裂纹、脏污、破洞、变形、凹坑、破损共8种
- 原型采集设备准备:包含1个顶拍相机加4个侧拍相机
- 工业级数据收集、标注、清洗过程:
使用3个基于HRNet-32w主干网络的Cascade RCNN进行检测、交叉验证,直到检测结果偏差小于预定条件(AP基本不变,修改标注的图片数/instance足够小)
Real-IAD数据统计分析:
更多的数据信息、下载方式及Benchmark 结果可移步项目主页:
Project Page: https://realiad4ad.github.io/Real-IAD/
基于该数据集的已有开源方法推荐:
AD Benchmark: https://github.com/zhangzjn/ader
MambaAD[NeurIPS'24]: https://github.com/lewandofskee/MambaAD
Dinomaly: https://github.com/guojiajeremy/Dinomaly
腾讯云智能生态计划
腾讯云智能,依托腾讯优图实验室、腾讯AILab、腾讯多媒体实验室、微信智聆、微信智言等腾讯顶级实验室的产品和技术能力,持续引入生态合作伙伴,共建智能生态。通过授权认证、商机共享、技术共建、平台助力、品牌升级、标杆打造等合作形式,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。
END