Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >昼夜无监督域自适应目标检测(附原代码)

昼夜无监督域自适应目标检测(附原代码)

作者头像
计算机视觉研究院
发布于 2025-01-07 01:45:53
发布于 2025-01-07 01:45:53
2120
举报

计算机视觉研究院专栏

Column of Computer Vision Institute

由于缺乏夜间图像注释,夜间目标检测是一个具有挑战性的问题。尽管有几种领域自适应方法,但实现高精度结果仍然是一个问题。

01、前景概要

在使用公认的师生框架的方法中,特别是对于小规模和低光物体,仍然可以观察到假阳性误差传播。我们提出了一种两阶段一致性无监督领域自适应网络2PCNet来解决这些问题。该网络在第一阶段使用来自教师的高置信度边界框预测,并将其附加到学生的区域建议中,供教师在第二阶段重新评估,从而产生高置信度和低置信度伪标签的组合。夜间图像和伪标签在用作学生的输入之前被缩小,从而提供更强的小规模伪标签。为了解决图像中弱光区域和其他夜间相关属性引起的错误,我们提出了一种称为NightAug的夜间特定增强管道。该管道涉及将随机增强(如眩光、模糊和噪声)应用于日间图像。在公开数据集上的实验表明,我们的方法比最先进的方法和直接在目标数据上训练的监督模型获得了20%的优越结果。

02、背景&动机

夜间目标检测在许多应用中都是至关重要的。然而,通过监督方法对注释数据的要求是不切实际的,因为带有注释的夜间数据很少,并且监督方法通常容易过度拟合训练数据。除其他原因外,这种稀缺性是由于光线条件差,使得夜间图像难以注释。因此,不假设注释可用性的方法更有优势。领域自适应(DA)是解决这一问题的有效方法,它允许使用现成的注释源日间数据集。

为了解决这个问题,我们提出了2PCNet,一种用于夜间目标检测的两阶段一致性无监督域自适应网络。我们的2PCNet将在第一阶段预测的高度自信的伪标签的边界框与学生的区域建议网络(RPN)提出的区域合并在一起。然后,教师在第二阶段使用合并后的提议来生成一组新的伪标签。这提供了高置信度和低置信度伪标签的组合。然后将这些伪标签与学生生成的预测进行匹配。然后,我们可以利用加权一致性损失来确保无监督损失的更高权重基于更强的伪标签,但允许较弱的伪标签影响训练。

配备了这种两阶段策略,我们解决了小规模对象的错误问题。我们设计了一种学生缩放技术,故意缩小学生的夜间图像及其伪标签。为了生成准确的伪标签,教师的图像保持在其全尺寸。这导致更容易预测的较大对象的伪标签被缩小到较小的对象,从而提高学生的小规模表现。夜间图像存在日间场景中未发现的多种复杂情况,如黑暗区域、眩光、突出的噪声、突出的模糊、不平衡的照明等。所有这些都造成了问题,因为接受日间图像训练的学生更倾向于日间域的特征。为了缓解这个问题,我们提出了NightAug,一组随机的夜间特定增强。NightAug包括在白天的图像中添加模拟夜间条件的人造眩光、噪音、模糊等。通过NightAug,我们能够减少学生网络对源数据的偏见,而不会导致对抗性学习或计算密集型翻译。总体而言,使用2PCNet,我们可以在图1中看到我们的结果在质量上的改进。

03、新框架设计

我们的2PCNet的体系结构如下图所示。我们的2PCNet由一个学生和一个教师网络组成。该学生是一个多域网络,在标记的白天图像(用NightAug增强)和未标记的夜间图像上进行训练。老师专注于夜间图像,为学生生成伪标签,是学生的指数移动平均值(EMA)。

在初始预训练阶段之后,教师开始产生伪标签,这允许学生初始化特征提取器和检测器。在2PCNet的第一阶段的每次迭代中,教师从夜间图像中产生伪标签。通过置信阈值对这些伪标签进行过滤。这是为了确保只给学生高置信度的伪标签。然后将来自伪标签的边界框与学生的RPN生成的区域建议相结合。合并后的区域建议然后用于从学生的RoI网络生成预测。在第二阶段,教师使用相同的合并区域建议来生成一组匹配的伪标签,其中每个伪标签都有从学生那里获得的相应预测。

Two-Phase Consistency

由于日间源图像和夜间目标图像之间存在较大的域间隙,教师无法生成高质量的伪标签。这种情况通常发生在整个场景中,但特别是对于具有强烈夜间特征的区域,例如弱光、眩光、不均匀照明等。教师只为与白天有更多相似性的区域生成自信的伪标签,因为它偏向于白天域。这种偏差给使用硬阈值来过滤分类交叉熵损失的伪标签的方法带来了问题。剩下的伪标签只包含具有日间属性的简单样本。因此,学生不会从较难(例如较暗)的区域学习。

由于对难样本(即具有高水平夜间属性的区域)的了解最少,教师开始预测高度自信但不正确的伪标签。当老师向学生提供这些不正确的伪标签时,一个粘性循环开始了,老师反过来用不正确的知识更新。因此,错误通过训练继续传播。在我们的案例中,这些误差明显发生在黑暗/眩光区域和小尺度物体中。为了解决错误传播的问题,我们设计了一种两阶段的方法,将高置信度的伪标签与其不太置信度的对应标签结合在一起。这种组合允许自信标签的高精度,并将不太自信标签的额外知识提炼到学生身上。

(从左到右,从上到下)GT边界框,教师预测的具有非极大抑制(NMS)和阈值(Bp)的边界框,由Bp指导的学生预测的边界框(Bstudent),以及教师预测的一致性损失的边界框。

Student-Scaling

为了确保不会忘记先前标度的知识,应用了标度因子的高斯函数。高斯函数的范数是从调度值中获得的。为了防止由于伪标签太小而产生额外的噪声,将去除面积低于阈值的标签。

NightAug

夜间图像有一系列日间场景中没有的复杂情况。这导致了师生框架中的一个问题,即学生会偏向于源领域。以前的方法试图解决这个问题,但要么需要计算密集型翻译,要么在框架中添加额外的领域分类器,这使训练变得复杂。我们提出了NightAug,一种夜间特定的增强管道,它是计算光,不需要训练。NightAug由一系列增强组成,目的是引导白天图像的特征与夜间图像的特征相似。

NightAug:原始图像(左上)和随机增强的图像:高斯模糊、伽马校正、亮度、对比度、眩光、高斯噪声和随机剪切

每个增强都有一个应用的概率,增强的强度是随机的。然后可以用原始图像的随机区域替换增强图像的随机区。该区域替换的概率随着每次迭代而降低。

04、实验及项目落地

Faster RCNN、Adaptive Teacher(AT)和我们的方法在SHIFT数据集上的定性结果,最右边是真实值。我们可以观察到,由于缺乏域自适应,Faster RCNN无法检测对象,而与我们的方法相比,AT有大量的小误报边界框,我们提出的方法与GT非常相似。

目前在很多城市为了赶工,有许多工地都是夜晚进行作业,为了作业过程中的安全施工以及非员工潜入等问题,某建筑企业采用了AI技术进行安全生产和管理。

© THE END

转载请联系本公众号获得授权

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
目标检测与生成对抗网络
1、A full data augmentation pipeline for small object detection based on generative adversarial networks
狼啸风云
2023/10/07
3520
ReliableStudent | 减轻噪声伪标签的半监督3D目标检测方法,超越 KITTI 3D目标检测在点云水平!
在深度学习近期发展的推动下,图像分类和目标检测领域已取得显著进展。大量数据集的可用性有助于加速这些进步。然而,为大规模数据集标注仍然是瓶颈,特别是对于2D和3D目标检测。半监督方法(SSA)已提出以解决此问题。与监督方法不同,这些方法仅需要有限数量的标注数据进行训练,其余数据未标注。
AIGC 先锋科技
2024/07/08
3500
ReliableStudent | 减轻噪声伪标签的半监督3D目标检测方法,超越 KITTI 3D目标检测在点云水平!
MIT & Caltech & AWS 提出 ALDI,目标检测新突破, 超越现有方法,再次刷新 SOTA!
ALDI++ 在 Cityscapes Foggy Cityscapes 上的AP50超过了先前最先进的方法+3.5,在 Sim10k Cityscapes 上超过了+5.7 AP50(作者的方法是唯一一种超过公正基准线的方法),在 CFC Kenai Channel 上超过了+2.0 AP50。作者的框架、数据集和最先进的方法为DAOD领域提供了一个关键的重新设定,并为未来的研究奠定了坚实的基础。
未来先知
2024/08/08
2310
MIT &  Caltech  & AWS 提出 ALDI,目标检测新突破, 超越现有方法,再次刷新 SOTA!
CVPR2023高质量论文 | Consistent-Teacher:半监督目标检测超强SOTA
在本研究中,研究者深入研究了半监督目标检测(SSOD)中伪目标的不一致性。核心观察结果是,振荡的伪目标破坏了精确的半监督检测器的训练。它不仅给学生的训练注入了噪声,而且导致了分类任务的严重过拟合。因此,研究者提出了一个系统的解决方案,称为一致教师,以减少不一致。首先,自适应锚分配(ASA)取代了基于静态IoU的策略,使学生网络能够抵抗噪声伪边界盒;然后,通过设计三维特征对齐模块(FAM-3D)来校准子任务预测。它允许每个分类特征在任意尺度和位置自适应地查询回归任务的最优特征向量。最后,高斯混合模型(GMM)动态地修正了伪框的得分阈值,从而稳定了基本事实的数量
计算机视觉研究院
2023/08/24
7470
CVPR2023高质量论文 | Consistent-Teacher:半监督目标检测超强SOTA
你的模型是不是换个场景就不行了?CAT 的完美设计解决类内偏差,场景自适应的目标检测就这么诞生了
Foggy Cityscapes数据集上,作者获得了52.5 mAP,相比于最先进方法的51.2 mAP,这是一个显著的提升。
集智书童公众号
2024/04/25
7720
你的模型是不是换个场景就不行了?CAT 的完美设计解决类内偏差,场景自适应的目标检测就这么诞生了
目标检测数据标注成本高怎么破?主动学习的自适应监督框架
下面要介绍的论文发表于BMVC2019,题为「An Adaptive Supervision Framework for Active Learning in Object Detection」,论文提出一个在目标检测中主动学习的自适应框架,在保证目标检测性能的同时大大节省了训练目标检测器的数据标注成本。
AI科技评论
2019/10/14
1.8K0
目标检测数据标注成本高怎么破?主动学习的自适应监督框架
无标签数据增强+高效注意力GAN:基于CARLA的夜间车辆检测精度跃升
现有的基于深度学习的物体检测模型在日间条件下表现良好,但在夜间却面临巨大挑战,这主要是因为这些模型主要是在日间图像上进行训练的。此外,使用夜间图像进行训练还带来了另一个挑战:即使是人类标注者也很难在弱光条件下准确标注物体。这一问题在交通应用中尤为突出,例如在夜间的乡村道路上检测车辆和其他感兴趣的物体,因为那里通常没有街道照明,车头灯可能会带来令人不快的眩光。本研究利用CARLA生成的合成数据进行从白天到黑夜的图像风格转换,引入了一个新颖的无标签数据增强框架,从而解决了这些难题。具体来说,该框架结合了高效注意力生成对抗网络(Efficient Attention Generative Adversarial Network)来实现从白天到夜晚的模式转换,并使用CARLA生成的合成夜间图像来帮助模型学习车辆前大灯的效果。为了评估所提出的框架的有效性,我们使用专门为农村夜间环境设计的增强数据集对YOLO11模型进行了微调,从而显著提高了夜间车辆检测能力。这种新方法简单而有效,提供了一种可扩展的解决方案,可用于在低能见度环境中增强基于人工智能的检测系统,并将物体检测模型的适用性扩展到更广泛的现实世界环境中。
CoovallyAIHub
2025/03/11
1770
无标签数据增强+高效注意力GAN:基于CARLA的夜间车辆检测精度跃升
海康研究院出品:具有场景自适应概念学习的无监督目标检测(附论文下载)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:http://www.jzus.zju.edu.cn
计算机视觉研究院
2022/06/16
1.1K0
海康研究院出品:具有场景自适应概念学习的无监督目标检测(附论文下载)
半监督辅助目标检测:自训练+数据增强提升精度(附源码下载)
计算机视觉研究院专栏 作者:Edison_G 近年来,半监督学习(SSL)受到越来越多的关注。在当没有大规模注释数据时,SSL提供了使用unlabel data来改善模型性能的方法。 公众号ID|ComputerVisionGzq学习群|扫码在主页获取加入方式 论文: https://arxiv.org/pdf/2005.04757.pdf 1 简要 半监督学习 (SSL) 有可能提高使用未标记数据的机器学习模型的预测性能。尽管最近取得了显着进展,但SSL的演示范围主要是图像分类任务。  在今天
计算机视觉研究院
2022/03/04
1K0
ICCV 2019 | 精确的端到端的弱监督目标检测网络
由于没有实例级类别标注,对于弱监督目标检测网络要精确的预测目标的位置具有挑战性。大多数现有的方法倾向于通过使用双阶段的学习过程来解决该问题,即多实例学习检测器,然后是具有边界框回归的强监督学习检测器。
BBuf
2019/12/12
1.4K0
ICCV 2019 | 精确的端到端的弱监督目标检测网络
目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)
论文地址:https://arxiv.org/pdf/2201.04620v1.pdf
计算机视觉研究院
2022/01/28
1.1K0
目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)
ForkGAN: Seeing into the Rainy Night
 我们提出了一种用于任务无关图像翻译的ForkGAN,它可以在恶劣的天气条件下增强多个视觉任务。评估了图像定位/检索、语义图像分割和目标检测三项任务。关键的挑战是在没有任何明确监督或任务意识的情况下实现高质量的图像翻译。我们的创新是一种具有一个编码器和两个解码器的叉形生成器,可以解开域特定信息和域不变信息的纠缠。我们强制天气条件之间的循环转换通过公共编码空间,并确保编码特征不显示有关域的信息。实验结果表明,我们的算法产生了最先进的图像合成结果,并提高了三视觉任务在恶劣天气下的性能。
狼啸风云
2023/10/07
4600
ForkGAN: Seeing into the Rainy Night
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
基于LiDAR的感知系统对于自动驾驶汽车[20]或移动机器人[41]的安全导航至关重要。一个关键挑战是在车辆环境中对物体进行可靠检测和分类[54]。最先进的(SOTA)三维目标检测方法在很大程度上依赖于用于训练的数据集的质量和多样性,同时也取决于这些数据集在推理过程中如何真实地反映现实世界条件。获取和标注此类数据仍然是一项重大的技术和实践挑战,既耗时又劳动密集。这在三维目标检测模型的大规模开发和部署中构成了一个主要障碍。
集智书童公众号
2024/05/10
9190
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
Cross-Domain Car Detection Using UnsupervisedImage-to-Image Translation: From Day to Night
 深度学习技术使最先进的模型得以出现,以解决对象检测任务。然而,这些技术是数据驱动的,将准确性委托给训练数据集,训练数据集必须与目标任务中的图像相似。数据集的获取涉及注释图像,这是一个艰巨而昂贵的过程,通常需要时间和手动操作。因此,当应用程序的目标域没有可用的注释数据集时,就会出现一个具有挑战性的场景,使得在这种情况下的任务依赖于不同域的训练数据集。共享这个问题,物体检测是自动驾驶汽车的一项重要任务,在自动驾驶汽车中,大量的驾驶场景产生了几个应用领域,需要为训练过程提供注释数据。在这项工作中,提出了一种使用来自源域(白天图像)的注释数据训练汽车检测系统的方法,而不需要目标域(夜间图像)的图像注释。 为此,探索了一个基于生成对抗网络(GANs)的模型,以实现生成具有相应注释的人工数据集。人工数据集(假数据集)是将图像从白天时域转换到晚上时域而创建的。伪数据集仅包括目标域的注释图像(夜间图像),然后用于训练汽车检测器模型。实验结果表明,所提出的方法实现了显著和一致的改进,包括与仅使用可用注释数据(即日图像)的训练相比,检测性能提高了10%以上。
狼啸风云
2023/10/07
3490
Cross-Domain Car Detection Using UnsupervisedImage-to-Image Translation: From Day to Night
Let There Be Light: Improved Traffic Surveillancevia Detail Preserving Night-to-Day Transfer
 近年来,在深度卷积神经网络(CNNs)的帮助下,图像和视频监控在智能交通系统(ITS)方面取得了长足的进步。作为最先进的感知方法之一,检测视频监控每帧中感兴趣的目标是ITS广泛期望的。目前,在具有良好照明条件的日间场景等标准场景中,物体检测显示出显著的效率和可靠性。然而,在夜间等不利条件下,物体检测的准确性会显著下降。该问题的主要原因之一是缺乏足够的夜间场景注释检测数据集。在本文中,我们提出了一个框架,通过使用图像翻译方法来缓解在不利条件下进行目标检测时精度下降的情况。 为了缓解生成对抗性网络(GANs)造成的细节破坏,我们建议利用基于核预测网络(KPN)的方法来重新定义夜间到日间的图像翻译。KPN网络与目标检测任务一起训练,以使训练的日间模型直接适应夜间车辆检测。车辆检测实验验证了该方法的准确性和有效性。
狼啸风云
2023/10/07
3080
Let There Be Light: Improved Traffic Surveillancevia Detail Preserving Night-to-Day Transfer
DTG-SSOD:最新半监督检测框架,Dense Teacher(附论文下载)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2207.05536.pdf 计算机视觉研究院专栏 作者:Edison_G “从稀疏到密集”的范式使SSOD的流程复杂化,同时忽略了强大的直接、密集的教师监督 01 概述 Mean-Teacher (MT) 方案在半监督目标检测 (SSOD) 中被广泛采用。在MT中,由教师的最终预测(例如,在非极大抑制 (NMS) 后处理之
计算机视觉研究院
2022/09/06
6270
DTG-SSOD:最新半监督检测框架,Dense Teacher(附论文下载)
Nice Trick | 不想标注数据了!有伪标签何必呢,Mixup+Mosaic让DINO方法再继续涨点
在深度学习时代,目标检测取得了显著的进展,但高度依赖昂贵的人工标注。因此,半监督学习越来越受到研究兴趣的青睐,它利用 未标注 数据来提高检测器性能,而不只是依赖标注。
集智书童公众号
2023/12/19
1.5K0
Nice Trick | 不想标注数据了!有伪标签何必呢,Mixup+Mosaic让DINO方法再继续涨点
GAN-Based Day-to-Night Image Style Transfer forNighttime Vehicle Detection
数据增强在训练基于CNN的检测器中起着至关重要的作用。以前的大多数方法都是基于使用通用图像处理操作的组合,并且只能产生有限的看似合理的图像变化。最近,基于生成对抗性网络的方法已经显示出令人信服的视觉结果。然而,当面临大而复杂的领域变化时,例如从白天到晚上,它们很容易在保留图像对象和保持翻译一致性方面失败。在本文中,我们提出了AugGAN,这是一种基于GAN的数据增强器,它可以将道路行驶图像转换到所需的域,同时可以很好地保留图像对象。这项工作的贡献有三个方面:(1)我们设计了一个结构感知的未配对图像到图像的翻译网络,该网络学习跨不同域的潜在数据转换,同时大大减少了转换图像中的伪影; 2) 我们定量地证明了车辆检测器的域自适应能力不受其训练数据的限制;(3) 在车辆检测方面,我们的目标保护网络在日夜困难的情况下提供了显著的性能增益。与跨领域的不同道路图像翻译任务的竞争方法相比,AugGAN可以生成更具视觉合理性的图像。此外,我们通过使用转换结果生成的数据集训练Faster R-CNN和YOLO来定量评估不同的方法,并通过使用所提出的AugGAN模型证明了目标检测精度的显著提高。
狼啸风云
2023/10/07
4610
GAN-Based Day-to-Night Image Style Transfer forNighttime Vehicle Detection
SOOD: Towards Semi-Supervised Oriented Object Detection
半监督物体检测,旨在探索未标记的数据以提高物体检测器,近年来已成为一项活跃的任务。然而,现有的SSOD方法主要集中在水平方向的物体上,而对航空图像中常见的多方向物体则没有进行探索。本文提出了一个新颖的半监督定向物体检测模型,称为SOOD,建立在主流的伪标签框架之上。针对空中场景中的定向物体,我们设计了两个损失函数来提供更好的监督。针对物体的方向,第一个损失对每个伪标签-预测对(包括一个预测和其相应的伪标签)的一致性进行了规范化处理,并根据它们的方向差距进行了适应性加权。第二种损失侧重于图像的布局,对相似性进行规范化,并明确地在伪标签和预测的集合之间建立多对多的关系。这样的全局一致性约束可以进一步促进半监督学习。我们的实验表明,当用这两个提议的损失进行训练时,SOOD在DOTA v1.5基准的各种设置下超过了最先进的SSOD方法。
狼啸风云
2023/10/07
5220
SOOD: Towards Semi-Supervised Oriented Object Detection
目标检测和分类的域适配研究简述
1、Progressive Domain Adaptation for Object Detection 2020年
狼啸风云
2020/06/18
2.5K0
推荐阅读
目标检测与生成对抗网络
3520
ReliableStudent | 减轻噪声伪标签的半监督3D目标检测方法,超越 KITTI 3D目标检测在点云水平!
3500
MIT & Caltech & AWS 提出 ALDI,目标检测新突破, 超越现有方法,再次刷新 SOTA!
2310
CVPR2023高质量论文 | Consistent-Teacher:半监督目标检测超强SOTA
7470
你的模型是不是换个场景就不行了?CAT 的完美设计解决类内偏差,场景自适应的目标检测就这么诞生了
7720
目标检测数据标注成本高怎么破?主动学习的自适应监督框架
1.8K0
无标签数据增强+高效注意力GAN:基于CARLA的夜间车辆检测精度跃升
1770
海康研究院出品:具有场景自适应概念学习的无监督目标检测(附论文下载)
1.1K0
半监督辅助目标检测:自训练+数据增强提升精度(附源码下载)
1K0
ICCV 2019 | 精确的端到端的弱监督目标检测网络
1.4K0
目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)
1.1K0
ForkGAN: Seeing into the Rainy Night
4600
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
9190
Cross-Domain Car Detection Using UnsupervisedImage-to-Image Translation: From Day to Night
3490
Let There Be Light: Improved Traffic Surveillancevia Detail Preserving Night-to-Day Transfer
3080
DTG-SSOD:最新半监督检测框架,Dense Teacher(附论文下载)
6270
Nice Trick | 不想标注数据了!有伪标签何必呢,Mixup+Mosaic让DINO方法再继续涨点
1.5K0
GAN-Based Day-to-Night Image Style Transfer forNighttime Vehicle Detection
4610
SOOD: Towards Semi-Supervised Oriented Object Detection
5220
目标检测和分类的域适配研究简述
2.5K0
相关推荐
目标检测与生成对抗网络
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档