前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >业界最大!腾讯优图发布Real-IAD大规模工业异常检测数据集!

业界最大!腾讯优图发布Real-IAD大规模工业异常检测数据集!

作者头像
腾讯云TI平台
发布2025-02-11 14:29:53
发布2025-02-11 14:29:53
800
举报
文章被收录于专栏:腾讯云TI平台腾讯云TI平台

本文已被CVPR2024收录

(上海交通大学,腾讯优图,复旦大学,荣旗工业科技,上海计算机软件技术开发中心)

Title:Real-IAD: A Real-World Multi-View Dataset for Benchmarking Versatile Industrial Anomaly Detection

Project Pagehttps://realiad4ad.github.io/Real-IAD/

动机:为什么构建Large-scale Real-world Real-IAD数据集

  • 一方面,大多数最先进的方法在MVTec / VisA等主流数据集上已经达到饱和(AUROC超过99%),无法很好地区分方法之间的差异,且由于难度较小而与实际应用场景之间存在较大差距,因此需要更具挑战性的数据集来支持AD领域的进一步研究
  • 另一方面,各种新的实用异常检测设置的研究受到数据集规模的限制(比如带噪和小样本更贴近实际应用的setting),存在评估结果过拟合的风险,因此需要更大规模的数据集来支持;
  • 工业生产中的良率通常介于60%-100%之间,与现有的100%良率实验setting不符,因此,需要更具实际应用价值的setting,即我们提出的Fully Unsupervised Industrial Anomaly Detection,FUIAD

Real-IAD数据集特性:

  • 更多的类别:30类真实产线物料
  • 大规模数据量:150K数据
  • 多种材料:金属,塑料,木材,陶瓷和混合材料
  • 多种缺陷类别:缺失、划伤、裂纹、脏污、破洞、变形、凹坑、破损
  • 多视角:5个拍摄角度(顶拍+4个侧拍)
  • 更高的分辨率:2K~5K
  • 支持多种实验设置:1)FUIAD;2)多视角AD;3)无监督AD;4)Zero-/Few-shot AD;5)带噪AD等

与主流的2D异常检测数据集规模及属性对比如下表

5个视角的采集效果图示例,包含两种典型异常场景:

1)缺陷可以在一个sample中的每个view都可见

2)缺陷仅在一个sample中部分view上可见

这更具有实际意义和更大的挑战性,将AD推向实际应用迈出了新的一步!

本文贡献

  • 提出了一个新的Real-IAD数据集,它比现有的主流数据集大十倍以上。它包括30类对象,每类对象包含5个拍摄角度,共计150K高分辨率图像。Real-IAD具有更大的缺陷面积和缺陷比例范围,能够更好地区分不同方法的性能,满足IAD的各种研究设置。
  • 基于Real-IAD数据集构建了一个更接近实际应用场景的FUIAD(Fully Unsupervised Industry Anomaly Detection)设置,其中仅使用大多数生产线的成品率大于60%的自然存在约束,而不引入额外的手动注释。
  • 我们报告了常用的IAD方法在Real-IAD数据集上在几种设置下的性能,并提供了一个极具挑战性的基准,以促进异常检测领域的发展。

拆解 Real-IAD 数据收集的具体过程,如下图所示:

  • 物料准备及缺陷产品构建
  • 材料:包含金属,塑料,木材,陶瓷和混合材料
  • 缺陷类型:包含缺失、划伤、裂纹、脏污、破洞、变形、凹坑、破损共8种
  • 原型采集设备准备:包含1个顶拍相机加4个侧拍相机
  • 工业级数据收集、标注、清洗过程:

使用3个基于HRNet-32w主干网络的Cascade RCNN进行检测、交叉验证,直到检测结果偏差小于预定条件(AP基本不变,修改标注的图片数/instance足够小)

Real-IAD数据统计分析:

更多的数据信息下载方式Benchmark 结果可移步项目主页:

Project Page: https://realiad4ad.github.io/Real-IAD/

基于该数据集的已有开源方法推荐:

AD Benchmark: https://github.com/zhangzjn/ader

MambaAD[NeurIPS'24]: https://github.com/lewandofskee/MambaAD

Dinomaly: https://github.com/guojiajeremy/Dinomaly

腾讯云智能生态计划

腾讯云智能,依托腾讯优图实验室、腾讯AILab、腾讯多媒体实验室、微信智聆、微信智言等腾讯顶级实验室的产品和技术能力,持续引入生态合作伙伴,共建智能生态。通过授权认证、商机共享、技术共建、平台助力、品牌升级、标杆打造等合作形式,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云AI平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 动机:为什么构建Large-scale Real-world Real-IAD数据集
  • 本文贡献
  • 拆解 Real-IAD 数据收集的具体过程,如下图所示:
  • Real-IAD数据统计分析:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档