前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >异常检测 SimpleNet

异常检测 SimpleNet

作者头像
为为为什么
发布于 2023-12-26 02:21:24
发布于 2023-12-26 02:21:24
7120
举报
文章被收录于专栏:又见苍岚又见苍岚

本文介绍异常检测 2023 年一篇优秀工作 —— SimpleNet。

基本信息

项目

内容

备注

方法名称

SimpleNet

论文题目

SimpleNet: A Simple Network for Image Anomaly Detection and Localization

论文连接

开源代码

发表时间

2023.05.28

方法类别

深度学习 -> 基于特征 -> 自监督学习

Detection AU-ROC

99.6%

Segmentation AU-ROC

98.1%

Segmentation AU-PRO

-

FPS

77 (FP32 on 3080ti)

核心思想

提取正常图像特征,人工在正常图像特征上加噪作为异常特征,训练分类网络进行分类判断

框架

SimpleNet 包含 特征提取器,特征适配器,异常特征生成器和判别器。

特征提取器

用类似 ResNet 网络提取不同层级的图像特征:

$$ \phi^{l,i}\sim\phi^{l}(x_{i})\in\mathbb{R}^{H_{l}\times\dot{W_{l}}\times C_{l}}, $$

l 表示层级,x_i 为输入数据,\phi 为特征

定义 Patch Size p ,将特征分为 p \times p 的小块,自适应池化:

$$ z_{h,w}^{l,i}=f_{agg}({\phi_{h',y'}^{l,i}|(h',y')\in\mathcal{N}_{p}^{h,w}}) $$

将来自不同层级的特征 resize 到相同(最大)尺寸,将特征在通道层拼接起来:

$$ o^i=f_{cat}(resize(z^{l',i},(H_0,W_0))|l'\in L $$ 简写为: $$ o^i=F_\phi(x^i) $$

特征适配器

由于工业图像通常与主干预训练中使用的数据集具有不同的分布,因此采用特征适配器 G_θ 将训练特征转移到目标域 q

$$ q_{h,w}^i=G_\theta(o_{h,w}^i) $$

特征适配器可以由简单的神经块组成,例如全连接层或多层感知器(MLP)。通过实验发现单个全连接层性能就足够好了。

异常特征生成器

为了训练判别器估计样本正常的似然概率,最简单的方法是对负样本(缺陷特征)进行采样,并将其与正常样本一起优化。但是异常样本的数量往往不足以支持训练,不同于其他文章生成异常图像,本文在特征空间中的正常样本上添加简单的噪声生成异常特征(文章声明该方法优于其他手工方法)。

异常特征是通过在正常特征 $q_{h,w}^i\in{\mathbb{R}^C}$ 上添加高斯噪声生成的,噪声 $\epsilon\in\mathbb{R}^C$ 独立同分布地采样于高斯分布 $\mathcal{N}(\mu,\sigma^2)$,异常特征 $q^{i-}_{h,w}$ 表示为: $$ q_{h,w}^{i-}=q_{h,w}^{i}+\epsilon $$

判别器

判别器用于判断数据是否为异常,直接输出 (h,w) 位置的正常水平,正常与添加过异常扰动的人工异常特征共同训练,相当于训练分类网络。

文章仅使用 2 层感知机来完成这个步骤。

判别器标记为 :

D_{\psi}(q_{h,w})\in\mathbb{R}.

训练

端到端训练判别器、特征适配器、特征提取器

单个 Patch 损失函数为:

$$ l_{h,w}^{i}=\max(0,th^{+}-D_{\psi}(q_{h,w}^{i}))+\max(0,-th^{-}+D_{\psi}(q_{h,w}^{i-})) $$

其中 th^+ = 0.5,th^-=-0.5

整体损失函数:

$$ \mathcal{L}=\min_{\theta,\psi}\sum_{x^i\in\mathcal{X}_{train}}\sum_{h,w}\frac{l_{h,w}^i}{H_0*W_0} $$

推断时不需要异常生成器了,异常分数直接由一系列前向推导得到:

$$ s_{h,w}^i=-D(q^i_{h,w}) $$ 推理过程中异常定位的异常图定义为: $$ S_{AL}(x_{i}):={s_{h,w}^{i}|(h,w)\in W_{0}\times H_{0}} $$

将结果 resize 到原始图像大小即可得到异常定位图。

同时图像级异常检测结果的得分:

S_{AD}(x_i):=\max_{(h,w)\in W_0\times H_0}s_{h,w}^i

由于网络简单,在 3080Ti 上 256*256 的图在未经过量化的模型上可以达到接近 80 的FPS。

参考资料

  • SimpleNet: A Simple Network for Image Anomaly Detection and Localization

文章链接: https://cloud.tencent.com/developer/article/2374474

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-12-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
什么特征进行交互才是有效的?
本文主要针对推荐系统中的特征交互而提出的相关方法,如果将所有可能的特征都进行交互,那消耗是很大的,本文提出HIRS用于直接生成有益特征交互。生成的特征交互的数量可以指定为远小于所有可能的交互的数量,因此模型运行时间更短。
秋枫学习笔记
2022/09/19
9000
Text to image论文精读 AttnGAN: Fine-Grained TexttoImage Generation with Attention
这篇文章提出了一种注意力生成对抗网络(AttnGAN),它允许注意力驱动、多阶段细化细粒度文本到图像的生成,此外,还提出了一种深度注意多模态相似性模型来计算细粒度图像-文本匹配损失以训练生成器,进而生成更逼真的图像。
中杯可乐多加冰
2024/05/02
5200
RealNet:从数据生成到模型训练的最新工业异常检测 | CVPR 2024
论文: RealNet: A Feature Selection Network with Realistic Synthetic Anomaly for Anomaly Detection
VincentLee
2024/08/19
4820
RealNet:从数据生成到模型训练的最新工业异常检测 | CVPR 2024
异常检测 PatchSVDD
改进 deep SVDD,提高异常检测能力与添加瑕疵定位能力,输出异常位置的热力图。
为为为什么
2023/12/26
4500
异常检测 PatchSVDD
异常检测 EfficientAD
常用的异常检测特征提取网络都是 ImageNet 预训练的 backbone, 典型的是 WideResNet-101, 文章使用四次卷积的网络作为特征提取器
为为为什么
2024/01/09
1.8K1
异常检测 EfficientAD
RecSys'22|CARCA:交叉注意力感知上下文和属性进行推荐
本文将用户的上下文信息和商品的属性结合起来考虑,提出上下文和属性感知推荐模型 (CARCA) ,该模型可以通过多头自注意力块将上下文特征和商品属性结合起来。现有的大部分序列推荐方法是采用序列中最近的商品表征和目标商品计算点击来计算评分,而CARCA利用交叉注意力记住计算所有序列商品和目标商品来预测他们的最终分数。利用交叉注意力,计算旧商品和最近商品之间的相关性以及它们对决定接下来推荐哪个项目的影响。
秋枫学习笔记
2022/09/19
6970
异常检测 DeepSVDD
基于核的单分类异常检测方法难以处理高维样本特征而且计算效率低,因此论文中对此类方法进行优化提出了深度 Deep SVDD 模型。主要想法是利用神经网络训练来最小化计算样本特征空间的划分超球面,然后根据球心和测试样本点间的距离来判定样本点是否是异常。
为为为什么
2023/12/26
7450
异常检测 DeepSVDD
AAAI 2024 | Diffusion扩散模型用于生成任意风格的复杂字的使用配方
本文分享 AAAI 2024 论文FontDiffuser: One-Shot Font Generation via Denoising Diffusion with Multi-Scale Content Aggregation and Style Contrastive Learning,Diffusion 扩散模型用于生成任意风格的复杂字的使用配方。
CV君
2023/12/26
5260
AAAI 2024 | Diffusion扩散模型用于生成任意风格的复杂字的使用配方
异常检测 DDAD
DDAD 是 2024 年以前 MVTec AD 数据集上性能最好的异常检测模型,本文解读相关论文并对源码进行解读
为为为什么
2024/01/11
1.9K1
异常检测 DDAD
超越BEV视角 | 新型紧凑占用Transformer助力自动驾驶3D占用预测
基于视觉的3D占用预测旨在估计周围 ego-vehicle 所包围的 3D Voxel 的空间占用状态,这为 3D 场景提供了全面的 3D 理解。通过将整个空间划分为 Voxel 并预测其占用和语义信息,3D 占用网络赋予了通用的物体表示能力,其中超出词汇的物体和异常情况可以很容易地表示为 _[占用;未知]_。
集智书童公众号
2023/12/12
9480
超越BEV视角 | 新型紧凑占用Transformer助力自动驾驶3D占用预测
【论文阅读】GETNext:Trajectory Flow Map Enhanced Transformer for Next POI Recommendation
authors:: Song Yang, Jiamou Liu, Kaiqi Zhao container:: Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval year:: 2022 DOI:: 10.1145/3477495.3531983 rating:: ⭐⭐️⭐️ share:: false comment:: 论文的主干网络仍然是 Transformer,通过构建 POI 之间的转移权重图(trajectory flow map)并通过 GCN 进行 POI Embedding;最后,又同时预测 POI、时间、类别,加强了损失函数。
EmoryHuang
2022/10/31
8060
【论文阅读】GETNext:Trajectory Flow Map Enhanced Transformer for Next POI Recommendation
台大提出 DQ-DETR | 用简简单单 3 步改进 DETR 即可完成小目标检测的大跨越
卷积神经网络(CNNs)在处理RGB语义和空间纹理特征方面具有优势。大多数目标检测方法主要基于CNNs。例如,Faster R-CNN 引入了一个区域 Proposal 网络来生成潜在的目标区域。FCOS 应用一个中心预测分支来提高边界框的质量。
集智书童公众号
2024/04/12
2.4K0
台大提出 DQ-DETR |  用简简单单 3 步改进 DETR 即可完成小目标检测的大跨越
深度学习应用篇-元学习[15]:基于度量的元学习:SNAIL、RN、PN、MN
元学习可以被定义为一种序列到序列的问题, 在现存的方法中,元学习器的瓶颈是如何去吸收同化利用过去的经验。 注意力机制可以允许在历史中精准摘取某段具体的信息。
汀丶人工智能
2023/10/11
8160
深度学习应用篇-元学习[15]:基于度量的元学习:SNAIL、RN、PN、MN
浙江理工 & 谷歌开源 CFMW | 挑战恶劣天气,Mamba 引领目标检测新风向!
在开放和动态的环境中,目标检测面临如雨、雾和雪等具有挑战性的天气条件。基于深度学习的目标检测方法的快速发展显著提高了识别和分类物体的能力。得益于先进的特征提取和融合策略,跨模态目标检测方法已达到高精度,例如CFT(杨等人,2017年)、GAFF(杨等人,2017年)和CFR
集智书童公众号
2024/05/10
1.6K0
浙江理工 &  谷歌开源 CFMW | 挑战恶劣天气,Mamba 引领目标检测新风向!
CVPR2023 | PVDM:在投影潜在空间中的视频概率扩散模型
深度生成模型的最新进展表明,它们有望在各个领域合成高质量、逼真的样本,例如图像、音频、3D 场景 、自然语言等。作为下一步,一些作品已经积极关注更具挑战性的视频合成任务。与其他领域的成功相比,由于视频的高维性和复杂性,在高分辨率帧中包含复杂的时空动态,因此生成质量与真实世界的视频相去甚远。
用户1324186
2023/12/28
5720
CVPR2023 | PVDM:在投影潜在空间中的视频概率扩散模型
ICCV2023论文精读:用于三维分析的基于聚类的点云表示学习
点云分析(如三维分割和检测)是一个具有挑战性的任务,不仅因为点云是数百万点的无序的点组成的不规则几何形状,而且深度、视角、遮挡等会使点云产生的巨大变化。当前的研究非常关注神经网络对复杂点云几何形状的补全,但对一个基本问题视而不见:如何学习一个适当的点嵌入空间,该空间既注意区分语义又考虑具有挑战性的变化?为此,作者提出了一种基于聚类的点云分析表示学习方案。
BBuf
2023/08/22
1.2K0
ICCV2023论文精读:用于三维分析的基于聚类的点云表示学习
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
SCTransNet有效地编码了目标与背景之间的语义差异,从而提升了其内部表征,以准确检测小红外目标。 在三个公开数据集NUDT-SIRST、NUAA-SIRST和IRSTD-1k上的大量实验表明,所提出的SCTransNet优于现有的IRSTD方法。 代码:https://github.com/xdFai
集智书童公众号
2024/02/21
2K0
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
WWW'22「京东」使用变分推断学习冷启动embedding
本文提出变分embedding学习框架VELF来缓解CTR预测中的冷启动问题,VELF 通过两种方式缓解由数据稀疏性引起的过拟合来解决冷启动问题:
秋枫学习笔记
2022/09/19
5710
部署必备 | 目标检测量化效果差不知道怎么解决?Cal-DETR带来更全面的分析基础!
代码和预训练模型: https://github.com/akhtarvision/cal-detr
集智书童公众号
2023/11/22
6800
部署必备 | 目标检测量化效果差不知道怎么解决?Cal-DETR带来更全面的分析基础!
CIKM'21「网易」新用户冷启动:MAIL生成虚拟用户交互表征
本文是针对新用户方面的冷启动文章,作者提出双塔结构的MAIL,一个塔用于冷启动,另一个塔关注排序问题。
秋枫学习笔记
2022/09/19
4710
推荐阅读
相关推荐
什么特征进行交互才是有效的?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档