前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >CVPR 2024 | 图像检测类(目标、deepfake、异常)!AIGC扩散模型diffusion解决detection任务

CVPR 2024 | 图像检测类(目标、deepfake、异常)!AIGC扩散模型diffusion解决detection任务

作者头像
公众号机器学习与AI生成创作
发布于 2024-04-12 06:28:09
发布于 2024-04-12 06:28:09
1.9K0
举报

目标跟踪

1、Delving into the Trajectory Long-tail Distribution for Muti-object Tracking

多目标跟踪(Multiple Object Tracking,MOT)是计算机视觉领域中一个关键领域,有广泛应用。当前研究主要集中在跟踪算法的开发和后处理技术的改进上。然而,对跟踪数据本身的特性缺乏深入的研究。

本研究首次对跟踪数据的分布模式进行探索,并发现现有 MOT 数据集中存在明显的长尾分布问题。发现不同行人分布存在显著不平衡现象,将其称为“行人轨迹长尾分布”。针对这一挑战,提出一种专门设计用于减轻这种分布影响的策略。具体而言,提出两种数据增强策略,包括静态摄像机视图数据增强(SVA)和动态摄像机视图数据增强(DVA),针对视点状态,以及面向 Re-ID 的 Group Softmax(GS)模块。SVA 是为了回溯并预测尾部类别的行人轨迹,而 DVA 则使用扩散模型改变场景的背景。GS 将行人划分为不相关的组,并对每个组进行 softmax 操作。

策略可以集成到许多现有的跟踪系统中,实验证实方法在降低长尾分布对多目标跟踪性能的影响方面的有效性。https://github.com/chen-si-jia/Trajectory-Long-tail-Distribution-for-MOT

目标检测

2、SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection

基于 LiDAR 的三维物体检测,在自动驾驶中起关键作用。目前已有的高性能三维物体检测器通常在骨干网络和预测头中构建密集特征图。然而,随着感知范围增加,密集特征图带来的计算成本呈二次增长,使得这些模型很难扩展到长距离检测。最近一些研究尝试构建完全稀疏的检测器来解决这个问题,然而所得模型要么依赖于复杂的多阶段流水线,要么表现不佳。

本文提出 SAFDNet,简单高效,专为完全稀疏的三维物体检测而设计。在 SAFDNet 中,设计了一种自适应特征扩散策略来解决中心特征丢失的问题。在 Waymo Open、nuScenes 和 Argoverse2 数据集上进行大量实验证明,SAFDNet 在前两个数据集上的性能略优于先前的 SOTA,但在具有长距离检测特点的最后一个数据集上表现更好,验证 SAFDNet 在需要长距离检测的场景中的有效性。

在 Argoverse2 上,SAFDNet 在速度上比先前最好的混合检测器 HEDNet 快 2.1 倍,并且相对于先前最好的稀疏检测器 FSDv2 提高了 2.1% 的 mAP,速度提高了 1.3 倍。https://github.com/zhanggang001/HEDNet

3、DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception

当前的感知模型严重依赖于资源密集型数据集,因此需要创新性的解决方案。利用最近在扩散模型和合成数据方面的进展,通过构造各种标签图像输入,合成数据有助于下游任务。尽管之前的方法已经分别解决了生成和感知模型的问题,但是 DetDiffusion 是第一个在生成有效数据的感知模型方面进行了整合的方法。

为增强感知模型的图像生成能力,引入感知损失(P.A. loss)通过分割来改善质量和可控性。为提高特定感知模型的性能,方法通过提取和利用感知感知属性(P.A. Attr)来定制数据增强。来自目标检测任务的实验结果凸显了 DetDiffusion 在布局导向生成方面的出色性能,显著提高了下游检测性能。

4、SDDGR: Stable Diffusion-based Deep Generative Replay for Class Incremental Object Detection

在类别增量学习(CIL)领域,generative replay已成为缓解灾难性遗忘的方法,随着生成模型的不断改进,越来越受到关注。然而,在类别增量物体检测(CIOD)中的应用受到很大限制,主要是由于涉及多个标签的场景的复杂性。

本文提出一种名为stable diffusion deep generative replay(SDDGR)的用于 CIOD 的新方法。方法利用基于扩散的生成模型与预训练的文本到扩散网络相结合,生成真实多样的合成图像。SDDGR采用迭代优化策略,生成高质量的旧类别样本。此外,采用L2知识蒸馏技术,以提高合成图像中先前知识的保留。此外,方法还包括对新任务图像中的旧对象进行伪标签,以防止将其错误分类为背景元素。

对COCO 2017数据集的大量实验表明,SDDGR在各种CIOD场景下明显优于现有算法,达到了新的技术水平。

关键点检测

5、Pose-Guided Self-Training with Two-Stage Clustering for Unsupervised Landmark Discovery

无监督的Unsupervised landmarks discovery(ULD)是具有挑战性的计算机视觉问题。为利用扩散模型在ULD任务中的潜力,首先,提出一种基于随机像素位置的简单聚类的零样本ULD基线,通过最近邻匹配提供了比现有ULD方法更好的结果。其次,在零样本性能的基础上,通过自训练和聚类开发了一种基于扩散特征的ULD算法,以显著超越以前的方法。第三,引入一个基于生成潜在姿势代码的新代理任务,并提出了一个两阶段的聚类机制,以促进有效的伪标签生成,从而显著提高性能。

总的来说,方法在四个具有挑战性的基准测试(AFLW、MAFL、CatHeads 和 LS3D)上一贯优于现有的最先进方法。

deepfake检测

6、Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection

扩散模型极大提高了图像生成质量,使得真实图像和生成图像之间越来越难以区分。然而,这一发展也引发了重大的隐私和安全问题。针对这一问题,提出一种新的潜变量重构误差引导特征优化方法(Latent REconstruction error guided feature REfinement, LaRE2),用于检测生成图像。

提出潜变量重构误差(Latent Reconstruction Error,LaRE),一种基于重构误差的潜在空间特征,用于生成图像检测。LaRE 在特征提取效率方面超过了现有方法,同时保留了区分真实与伪造图像所需的关键线索。为了利用 LaRE,提出一个带有误差引导特征优化模块(EGRE)的方法,通过 LaRE 引导图像特征的优化,以增强特征的辨别力。

EGRE 采用对齐然后细化机制,可以从空间和通道角度有效地细化图像特征,以进行生成图像检测。在大规模 GenImage 基准测试上的大量实验证明LaRE2 的优越性,在 8 个不同的图像生成器中超过了最好的 SoTA 方法,平均 ACC/AP 高达 11.9%/12.1%。LaRE 在特征提取成本方面也超越了现有方法,速度提升8倍。

异常检测

7、RealNet: A Feature Selection Network with Realistic Synthetic Anomaly for Anomaly Detection

自监督特征重建方法在工业图像异常检测和定位方面显示出有希望进展。这些方法在合成真实且多样化的异常样本以及解决预训练特征的特征冗余和预训练偏差方面仍然面临挑战。

这项工作提出 RealNet,一种具有现实合成异常和自适应特征选择的特征重建网络。它包含三个关键创新:首先,提出强度可控扩散异常合成(SDAS),一种基于扩散过程的合成策略,能够生成具有不同异常强度的样本,模仿真实异常样本的分布。其次,开发了异常感知特征选择(AFS),一种选择具有代表性和判别性的预训练特征子集的方法,以提高异常检测性能,同时控制计算成本。第三,引入了重建残差选择(RRS),一种自适应选择判别残差以跨多个粒度级别全面识别异常区域的策略。

在四个基准数据集上评估 RealNet,结果表明与当前最先进的方法相比,图像 AUROC 和像素 AUROC 都有改进。https://github.com/cnulab/RealNet

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与AI生成创作 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CVPR 2024 | 绝了!!最新 diffusion 扩散模型梳理!100+篇论文、40+研究方向!
扩散概率模型(DPMs)在高分辨率图像生成方面显示出显著性能,但由于通常需要大量采样步骤,其采样效率仍有待提高。高阶ODE求解在DPMs中的应用的最新进展使得能够以更少的采样步骤生成高质量图像。然而,大多数采样方法仍使用均匀的时间步长,在使用少量步骤时并不是最优的。
公众号机器学习与AI生成创作
2024/04/18
6.7K0
CVPR 2024 | 绝了!!最新 diffusion 扩散模型梳理!100+篇论文、40+研究方向!
CVPR 2020 | 旷视研究院16篇(含6篇Oral)收录论文亮点集锦
IEEE国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 大会官方论文结果公布,旷视研究院 16 篇论文被收录(其中含 6篇 Oral 论文),研究领域涵盖物体检测与行人再识别(尤其是遮挡场景),人脸识别,文字检测与识别,实时视频感知与推理,小样本学习,迁移学习,3D感知,GAN与图像生成,计算机图形学,语义分割,细粒度图像,对抗样本攻击等众多领域,取得多项领先的技术研究成果,这与已开放/开源的旷视AI生产力平台Brain++密不可分。本文把 16 篇论文汇在一起,逐篇做了亮点集锦式的抢先解读。 01 论文名称:DPGN: Distribution Propagation Graph Network for Few-shot Learning 论文链接:https://arxiv.org/abs/2003.14247 关键词:小样本学习,图网络
CV君
2020/04/20
1.2K0
ECCV 2020 | 腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
近日,计算机视觉方向的三大国际顶级会议之一的ECCV 2020公布论文获奖结果。本次ECCV 2020有效投稿5025篇,最终被接受发表论文1361篇,录取率为27%,较上届有所下降。其中,oral的论文数为104篇,占提交总量的2%;spotlight的数目为161篇,占提交总量的5%;其余论文均为poster。
深度学习技术前沿公众号博主
2020/07/28
1.5K0
ECCV 2020 | 腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
推荐几篇开源论文,包含人脸、目标检测跟踪、分割、去噪、超分辨率等
本文推荐本周值得关注的已开源论文,包含图像超分辨率、利用疼痛类型之间的域迁移来识别马的疼痛表情的研究、人脸检测识别、图像去噪、分割、手写文本行分割、妆容迁移与卸妆、伪装物体检测等共计 12 篇。
CV君
2021/06/08
9210
推荐几篇开源论文,包含人脸、目标检测跟踪、分割、去噪、超分辨率等
恶劣天气下的目标检测
1、Object Detection in Fog Degraded Images
狼啸风云
2021/05/19
3.5K0
一文看尽 6篇 CVPR2021 伪装目标检测、旋转目标检测论文
本文对 CVPR 2021 检测大类中的“伪装目标检测”、“旋转目标检测”领域的论文进行了盘点,将会依次阐述每篇论文的方法思路和亮点。在极市平台回复“CVPR21检测”,即可获得打包论文 >>加入极市CV技术交流群,走在计算机视觉的最前沿
狼啸风云
2021/08/10
4K0
【CVPR 2023的AIGC应用汇总(8)】3D相关(编辑/重建/生成) diffusion扩散/GAN生成对抗网络方法
【CVPR 2023的AIGC应用汇总(5)】语义布局可控生成,基于diffusion扩散/GAN生成对抗
公众号机器学习与AI生成创作
2023/08/22
1.1K0
【CVPR 2023的AIGC应用汇总(8)】3D相关(编辑/重建/生成) diffusion扩散/GAN生成对抗网络方法
三维目标跟踪简介
在所有的项目中,其中有一个最突出的,来自一位工程实习生,他撰写了一篇基于相机的3D目标跟踪的论文。
一点人工一点智能
2023/08/04
9000
三维目标跟踪简介
RealNet:从数据生成到模型训练的最新工业异常检测 | CVPR 2024
论文: RealNet: A Feature Selection Network with Realistic Synthetic Anomaly for Anomaly Detection
VincentLee
2024/08/19
4480
RealNet:从数据生成到模型训练的最新工业异常检测 | CVPR 2024
ICCV 2023 | 最全AIGC梳理,5w字30个diffusion扩散模型方向,近百篇论文!
内容和风格(Content and style disentanglement,C-S)解耦是风格迁移的一个基本问题和关键挑战。基于显式定义(例如Gram矩阵)或隐式学习(例如GANs)的现有方法既不易解释也不易控制,导致表示交织在一起并且结果不尽如人意。
公众号机器学习与AI生成创作
2024/02/29
3.6K0
ICCV 2023 | 最全AIGC梳理,5w字30个diffusion扩散模型方向,近百篇论文!
YOLO11-JDE:利用自监督再识别技术实现快速准确的多目标跟踪
YOLO11-JDE,它是一种快速准确的多目标跟踪(MOT)解决方案,将实时目标检测与自监督再识别(Re-ID)相结合。通过在YOLO11s中加入专门的再识别分支,该模型可以执行联合检测和嵌入(JDE),为每次检测生成外观特征。再识别分支在完全自我监督的情况下进行训练,同时进行检测训练,从而消除了对昂贵的身份标记数据集的需求。三重损失采用硬正向和半硬负向最小化策略,用于学习鉴别性嵌入。数据关联通过定制的跟踪实现得到了增强,成功地整合了运动、外观和位置线索。YOLO11-JDE在MOT17和MOT20基准测试中取得了具有竞争力的结果,在FPS方面超过了现有的JDE方法,使用的参数也减少了10倍。因此,该方法在实际应用中是一个极具吸引力的解决方案。
CoovallyAIHub
2025/02/17
1950
YOLO11-JDE:利用自监督再识别技术实现快速准确的多目标跟踪
盘点GAN在目标检测中的应用
1,2017-CVPR: A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection 摘要 如何学习对遮挡和变形不敏感的物体检测器?当前解决方案主要使用的是基于数据驱动的策略:收集具有不同条件下的对象物体的大规模数据集去训练模型,并期望希望最终可学习到不变性。 但数据集真的有可能穷尽所有遮挡吗?作者认为,像类别一样,遮挡和变形也有长尾分布问题:一些遮挡和变形在训练集是罕见的,甚至不存在。 提出了一种解决方案:学习一个对抗网
公众号机器学习与AI生成创作
2020/10/27
1.7K0
盘点GAN在目标检测中的应用
ECCV 2018|商汤37篇论文入选,为你解读精选论文(附链接+开源资源)
【导读】9 月 8 日-14 日,每两年举办一次的 2018 欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,本次会议总共收到了 2439 篇有效的论文,相比上一届 2016年会议增加了 65% ,其中有 776 篇被接受( 31.8 % )。可以说,今年是国内各高校、企业研究机构收获丰富的一年,无论是过去的 CVPR、ICCV 大会,都是华人的成果占据半壁江山,可见国内计算机视觉这两年来的迅猛的发展。
AI科技大本营
2018/09/28
1.2K0
ECCV 2018|商汤37篇论文入选,为你解读精选论文(附链接+开源资源)
CVPR小样本检测:蒸馏&上下文助力小样本检测(代码已开源)
计算机视觉研究院专栏 作者:Edison_G 目标检测现在的框架越来越多,我们“计算机视觉研究院”最近也分享了众多的目标检测框架!今天我们继续分享一个最新的检测框架——YOLOR。 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文:https://arxiv.org/pdf/2103.17115.pdf 开源代码: https://github.com/hzhupku/DCNet 1 前言 传统的基于深度学习的目标检测方法需要大量的边界框标注数据进行训练,获得
计算机视觉研究院
2022/03/14
1.4K0
犀牛鸟硬核 | CVPR 2023腾讯部分入选论文报告视频
CVPR 2023(The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2023,国际计算机视觉与模式识别会议)于6月18日-22日在加拿大温哥华召开。
腾讯高校合作
2023/08/08
9290
犀牛鸟硬核 | CVPR 2023腾讯部分入选论文报告视频
DiffusionDet:用于对象检测的扩散模型
Shoufa Chen1, Peize Sun1, Yibing Song2, Ping Luo1 1The University of Hong Kong 2Tencent AI Lab {sfchen, pzsun, pluo}@cs.hku.hk yibingsong.cv@gmail.com
3D视觉工坊
2023/04/29
1.2K0
DiffusionDet:用于对象检测的扩散模型
工业应用中基于三维模型的6D目标检测综述
文章名称:A Survey of 6D Object Detection Based on 3D Models for Industrial Applications,J. Imaging | Free Full-Text | A Survey of 6D Object Detection Based on 3D Models for Industrial Applications (mdpi.com)
3D视觉工坊
2023/04/29
1.3K0
工业应用中基于三维模型的6D目标检测综述
17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
全球计算机视觉顶级会议CVPR2020 (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议) 即将于2020年6月14日-19日在美国西雅图召开。
AI科技评论
2020/03/10
1.1K0
17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
AIGC生成图像检测:全面分析与比较主流方案
随着 AIGC 技术的发展,由 AI 所生成的虚假图像的检测问题正成为一个新的研究热点。但是现有检测方法的实验条件与测试数据集不完全相同,无法直接横向对比检测性能。为此,我们针对目前现有主流AIGC图像检测方案进行全面分析与比较。在保证相同训练集与实验条件的情况下,分析测试目前检测算法的检测准确率与泛化性等性能指标,为AIGC生成图像检测领域提供一项基准的实验对比平台(Benchmark),同时整合并开源了多种现有AIGC生成图像的检测算法。
CV君
2023/11/30
2.2K0
AIGC生成图像检测:全面分析与比较主流方案
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
近日,ECCV(European Conference on Computer Vision)组委会公布了录用论文名单,共有2395篇论文被录用,录用率27.9%。ECCV,即欧洲计算机视觉国际会议,是计算机视觉领域中最顶级的会议之一,与ICCV和CVPR并称为计算机视觉领域的“三大顶会”。ECCV每两年举行一次,会议内容广泛覆盖了计算机视觉的所有子领域,包括但不限于图像识别、物体检测、场景理解、视觉跟踪、三维重建、深度学习在视觉中的应用等。
公众号-arXiv每日学术速递
2024/07/31
7060
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
推荐阅读
CVPR 2024 | 绝了!!最新 diffusion 扩散模型梳理!100+篇论文、40+研究方向!
6.7K0
CVPR 2020 | 旷视研究院16篇(含6篇Oral)收录论文亮点集锦
1.2K0
ECCV 2020 | 腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
1.5K0
推荐几篇开源论文,包含人脸、目标检测跟踪、分割、去噪、超分辨率等
9210
恶劣天气下的目标检测
3.5K0
一文看尽 6篇 CVPR2021 伪装目标检测、旋转目标检测论文
4K0
【CVPR 2023的AIGC应用汇总(8)】3D相关(编辑/重建/生成) diffusion扩散/GAN生成对抗网络方法
1.1K0
三维目标跟踪简介
9000
RealNet:从数据生成到模型训练的最新工业异常检测 | CVPR 2024
4480
ICCV 2023 | 最全AIGC梳理,5w字30个diffusion扩散模型方向,近百篇论文!
3.6K0
YOLO11-JDE:利用自监督再识别技术实现快速准确的多目标跟踪
1950
盘点GAN在目标检测中的应用
1.7K0
ECCV 2018|商汤37篇论文入选,为你解读精选论文(附链接+开源资源)
1.2K0
CVPR小样本检测:蒸馏&上下文助力小样本检测(代码已开源)
1.4K0
犀牛鸟硬核 | CVPR 2023腾讯部分入选论文报告视频
9290
DiffusionDet:用于对象检测的扩散模型
1.2K0
工业应用中基于三维模型的6D目标检测综述
1.3K0
17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
1.1K0
AIGC生成图像检测:全面分析与比较主流方案
2.2K0
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
7060
相关推荐
CVPR 2024 | 绝了!!最新 diffusion 扩散模型梳理!100+篇论文、40+研究方向!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档