前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >无监督域适应、人体解析、视频异常检测和水果成熟度分类,推荐本周那些有意思的​CV综述

无监督域适应、人体解析、视频异常检测和水果成熟度分类,推荐本周那些有意思的​CV综述

作者头像
CV君
发布于 2023-03-06 02:28:08
发布于 2023-03-06 02:28:08
5130
举报

今天向大家推荐四篇近期发布的文献综述,包含无监督域适应、人体解析、视频异常检测和水果成熟度分类。

▌Source-Free Unsupervised Domain Adaptation: A Survey

  • 作者单位:北卡罗来纳大学教堂山分校
  • 论文链接:https://arxiv.org/abs/2301.00265

通过深度学习的无监督域适应(UDA)来解决由不同域的分布差异引起的域迁移问题。现有的 UDA 方法高度依赖于源域数据的可及性,由于隐私保护、数据存储和传输成本以及计算负担等原因,在实际应用场景中通常是有限的。

为了解决这个问题,业界近期提出了许多无源无监督域适应(SFUDA)的方法,这些方法在源数据不可访问的情况下,将知识从预先训练的源模型迁移到无标签的目标域。

该综述从技术角度对现有的 SFUDA 方法进行了及时和系统的文献回顾。具体来说,作者将目前的 SFUDA 研究分为两类,即白盒 SFUDA 和黑盒 SFUDA,如图1所示。 并根据它们使用的不同学习策略进一步划分为更细的子类别。还研究了每个子类别中的方法所面临的挑战,以及白盒和黑盒 SFUDA 方法的优势/劣势,总结了常用的基准数据集,并总结了在不使用源数据的情况下提高模型泛化能力的流行技术。最后讨论了该领域几个有前途的未来方向。

图1 (a)传统的无监督领域适应(UDA),(b)白盒无源UDA(SFUDA),和(c)黑盒SFUDA,

根据对源模型进行微调的不同策略,将现有的研究分为以下五个子类别:

图2 现有的无源无监督领域适应(SFUDA)方法的分类,以及未来展望

根据不同的图像生成策略,可以分为以下三个子类别:

图3 batch normalization statistics transfer

图4 surrogate source data construction

图5 GAN-based Image Generation

用于评估无源无监督域适应(SFUDA)方法性能的常用数据集一览:

▌Deep Learning Technique for Human Parsing: A Survey and Outlook

  • 作者单位:北京邮电大学
  • 论文链接:https://arxiv.org/abs/2301.00394
  • 代码链接:https://github.com/soeaver/awesome-human-parsing

人体解析的目的是将图像或视频中的人分割成多个像素级的语义部分。在过去的十年中,它在计算机视觉领域吸引了大量学者的研究兴趣,并在广泛的实际应用中得到了利用,如安全监控、社交媒体、视觉特效等等。尽管基于深度学习的人体解析解决方案已经取得了令人瞩目的成就,但许多重要的概念、现有的挑战和潜在的研究方向仍然是混乱的。

本篇综述通过介绍各自的任务设置、背景概念、相关问题和应用、代表性文献和数据集,全面回顾了三个核心子任务:Single human parsing (SHP)、Multiple human parsing (MHP) 和 Video human parsing (VHP),如图1所示。还介绍了这些方法在基准数据集上的定量性能比较。

此外,为了促进研究社区的可持续发展,作者还提出一个基于 transformer 的人体解析框架,如图6所示,通过通用的、简洁的和可扩展的解决方案为后续研究提供了一个高性能的基线。最后,指出了该领域中一系列未被充分研究的开放性问题,并提出了未来研究的新方向。

图1

图2 综述概览

表一 2012年至2022年具有代表性的人体解析工作时间轴。上半部分代表人体解析的数据集,下半部分代表人体解析的模型

表7 现有人体解析数据集的统计数据

表8 ATR 测试的SHP定量结果,包括像素精度(pixAcc)、前景像素精度(FGAcc)和F-1得分(F-1)。其中三个最好的分数分别用红色、蓝色和绿色标记。

表9 LIP值的定量SHP结果,包括像素精度(pixAcc)、平均像素精度(meanAcc)和平均IoU(mIoU)。三个最好的分数分别用红色、蓝色和绿色标记。

更多结果展示:

图6 M2FP架构

图7 M2FP与先前人体解析的最先进模型比较。M2FP在所有人类解析子任务上都取得了最先进的(PPP,CIHP和MHP-v2)或相当的性能(LIP)。

表14 M2FP在各种人体解析基准上的结果概述。标有下划线的表示以前的最先进结果;黑体字结果表示M2FP达到了新的最先进水平。

▌Skeletal Video Anomaly Detection using Deep Learning: Survey, Challenges and Future Directions

  • 作者单位:多伦多大学&加拿大多伦多大学的教学医院、UHN
  • 论文链接:https://arxiv.org/abs/2301.00114

现有的视频异常检测方法大多利用含有可识别的人脸和外观特征的视频。其中使用含有可识别人脸的视频会引起隐私问题,特别是在医院或社区环境中使用时。而基于外观的特征也可能对基于像素的噪声很敏感,使异常检测方法对背景的变化进行建模,并使其难以关注前景中人类的行动。目前,以骨架形式描述视频中人类运动的结构信息的方法是保护隐私的,可以克服基于外观的特征所带来的一些问题。

本篇综述就对使用从视频中提取的骨架的隐私保护型深度学习异常检测方法进行了调研。并根据各种学习方法提出一个新的算法分类法。得到的结论是,基于骨架的异常检测方法可以成为视频异常检测中一个可信的保护隐私的选择。最后,确定了主要的开放式研究问题,并提供了解决这些问题的指南。

相关综述概览:

▌Fruit Ripeness Classification: a Survey

  • 作者单位:Ca’ Foscari University (意大利)
  • 论文链接:https://arxiv.org/abs/2212.14441

本篇综述对水果成熟度分类任务提供了一个广泛的全景图。更具体地说,文中提供了这一问题的正式定义和一个涉及水果成熟的生物过程的总结。然后,讨论了可用于表示水果属性的不同类型的描述符:color, light spectrum, fluorescence, spectral imaging。因此,被描述的属性可以由统计学、机器学习或深度学习模型来处理。此外,深度学习可以对原始数据进行操作,从而使用户不必计算特定水果的复杂的工程特征。本篇综述回顾了文献中提出的进行水果成熟度分类的最新的自动化方法,强调了它们所操作的最常见的特征描述符。

香蕉成熟度的示例阶段:

枣子成熟度的示例阶段:

公开数据集:

查看更多最新CV类综述论文,推荐关注CV君一直在维护的这个项目:

https://github.com/52CV/CV-Surveys

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
视频行为识别(一)——综述
本次分享的文章是2023年收录在计算机视觉领域的顶刊“CVPR”(级别:视觉类TOP)期刊上。该期刊详细信息可关注公众号 AI八倍镜 点击菜单项查询。 论文地址:https://arxiv.org/abs/2305.15692
卡伊德
2023/07/21
1.5K0
视频行为识别(一)——综述
最新综述|深度学习的单目人体姿态估计
向大家推荐一篇今天新出的人体姿态估计综述文章 Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods ,对2014年到如今的单目人体姿态估计的深度学习方法进行了详细总结,值得做相关方向的同学参考。
CV君
2020/06/05
1.6K0
最新综述|深度学习的单目人体姿态估计
推荐几篇新出的 CVPR 2021开源论文,含图像分割、域适应、图像检索、视线估计等
本文分享几篇近期值得关注的 CVPR 2021 的开源论文,包括图像到图像翻译、全景分割、语义分割、域适应、图像检索、无监督学习,以及一篇关于首次对从人们相互注视的图像/视频中学习弱监督的三维视线范式(LAEO)的研究。
CV君
2021/06/08
1.2K0
推荐几篇新出的 CVPR 2021开源论文,含图像分割、域适应、图像检索、视线估计等
遥感领域中无监督域适应综述
本篇综述详细介绍了195篇与遥感无监督域适应相关的论文,已经被Remote sensing 2022收录。
CV君
2023/03/06
1.1K0
遥感领域中无监督域适应综述
25篇最新CV领域综述性论文速递!涵盖15个方向:目标检测/图像处理/姿态估计/医学影像/人脸识别等方向
标题:Deep Domain Adaptive Object Detection: a Survey
深度学习技术前沿公众号博主
2020/05/18
1.8K0
【首创】新加坡国立大学LV实验室发布多人图像解析数据集与模型
【新智元导读】 近日,新加坡国立大学LV实验室首次提出多人解析(Multi-Human Parsing)任务,对传统的人物解析进行了拓展与延伸,从而更好地匹配现实应用场景。他们构建了一个全新的大规模多人解析数据集(MHP),并给出了相应的评测标准,极大地推进了深度学习与计算机视觉领域相关技术的发展。 基于人物图像的细粒度解析是计算机视觉领域的一个非常重要的任务。人物解析(Human Parsing)指的是将人物图像按像素级别分割成属于身体部位或衣物项目的多个语义一致的区域。人物解析技术是很多实际应用的基础
新智元
2018/03/28
1.6K0
【首创】新加坡国立大学LV实验室发布多人图像解析数据集与模型
想学图像分割,强烈建议从这5篇图像分割算法综述
在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步。去年上半年,极市曾盘点过计算机视觉领域综述论文,并进行了分类整理,得到了很多读者的支持。因此,在2021年初,我们对2020年出现的全部计算机视觉综述论文进行了分方向梳理,希望能帮助大家学习进步。
AI算法与图像处理
2021/02/05
3.4K0
想学图像分割,强烈建议从这5篇图像分割算法综述
基于深度学习的单目人体姿态估计方法综述(一)
原文:Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods
计算机视觉
2021/03/16
1.7K0
工业缺陷检测深度学习方法综述
基于深度学习的工业缺陷检测方法可以降低传统人工质检的成本,提升检测的准确性与效率,因而在智能制造中扮演重要角色,并逐渐成为计算机视觉领域新兴的研究热点之一。其被广泛地应用于无人质检、智能巡检、质量控制等各种生产与运维场景中。
一点人工一点智能
2022/12/27
1.8K0
工业缺陷检测深度学习方法综述
ECCV 2018 | 中山大学&商汤提出部分分组网络PGN,解决实例级人体解析难题
识别每个语义部分(如手臂、腿等)是人体解析中最基本、最重要的一部分。不仅如此,它还在许多高级应用领域中发挥了重要的作用,例如视频监控 [38]、人类行为分析 [10,22] 等。
机器之心
2018/08/21
1.7K0
ECCV 2018 | 中山大学&商汤提出部分分组网络PGN,解决实例级人体解析难题
CV Code|计算机视觉开源周报20200602期~文末送书
其中CV君以为最为值得关注的是密歇根大学发布的VirTex算法,从文字描述中训练视觉模型,得到更具表示能力的主干网络,在多个视觉任务中表现优异。这种结合CV 与NLP的工作,也许是未来CV能走的更远的重要方向。
CV君
2020/06/19
8190
深度学习行人重识别综述与展望,TPAMI 2021 最新文章
摘要:行人重识别(Person Re-Identification,简称Re-ID),是一种利用计算机视觉技术来检索图像或者视频序列中是否存在特定行人的AI技术,在智慧城市等监控场景中具有重要的应用意义和前景。本文介绍我们最新的IEEE TPAMI综述论文 《Deep Learning for Person Re-identification: A Survey and Outlook》,该文作者来自武汉大学、起源人工智能研究院(IIAI)、北理工、英国萨里大学、Salesforce亚洲研究院。
3D视觉工坊
2021/01/13
2K0
深度学习行人重识别综述与展望,TPAMI 2021 最新文章
重磅综述!离群_异常_新类检测?开集识别?分布外检测?一文搞懂其间异同!
你是否也曾迷惑于“OD/AD/ND/OSR/OOD Detection”之间错综复杂的关系?
Amusi
2021/11/02
7441
CV Papers|计算机视觉论文推荐周报20200601期
6月第一周的周末,分享几篇本周CV领域的论文,其中上海交大实时语义分割模型LRNNet和Facebook借助NAS得到的主干网模型FBNetV3很吸引人。
CV君
2020/06/12
6560
南大清华发布《从单目图像中恢复三维人体网格》综述论文,涵盖246篇文献全面阐述单目3D人体网格恢复研究进展
---- 新智元报道   来源:专知 【新智元导读】来自南京大学和清华大学的最新研究论文《从单目图像中恢复三维人体网格》,提出了从而二维数据提升至三维网格过程中基于优化和基于回归的两种范式,第一次关注单目3D人体网格恢复任务的研究,并讨论了有待解决的问题和未来的发展方向。 从单目图像中估计人体的姿势和形状是计算机视觉领域中一个长期存在的问题。自统计学人体模型发布以来,三维人体网格恢复一直受到广泛关注。 为了获得有序的、符合物理规律的网格数据而开发了两种范式,以克服从二维到三维提升过程中的挑战:i)基于
新智元
2022/03/29
1K0
AI综述专栏 | 步态识别的深度学习综述
在科学研究中,从方法论上来讲,都应先见森林,再见树木。当前,人工智能科技迅猛发展,万木争荣,更应系统梳理脉络。为此,我们特别精选国内外优秀的综述论文,开辟“综述”专栏,敬请关注。
马上科普尚尚
2020/05/14
3.7K0
AI综述专栏 | 步态识别的深度学习综述
综述!基于图的时间序列异常检测方法
时间序列异常检测(TSAD)在各种应用中具有重要性,但面临挑战,需同时考虑变量内和变量间依赖性,基于图的方法在应对这方面取得了进展。
算法进阶
2024/04/12
6660
综述!基于图的时间序列异常检测方法
AI论文速读 |2024[TPAMI]【综述】自监督学习在时间序列分析的分类、进展与展望
题目:Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects
时空探索之旅
2024/11/19
2830
AI论文速读 |2024[TPAMI]【综述】自监督学习在时间序列分析的分类、进展与展望
7 Papers & Radios | 一块GPU跑ChatGPT体量模型;AI绘图又一神器ControlNet
机器之心 & ArXiv Weekly  参与:楚航、罗若天、梅洪源 本周重要论文包括 AI 绘图神器ControlNet、Transformer 模型综述等研究。 目录 Transformer models: an introduction and catalog High-throughout Generative Inference of Large Language Models with a Single GPU Temporal Domain Generalization with Drift-
机器之心
2023/02/27
6580
7 Papers & Radios | 一块GPU跑ChatGPT体量模型;AI绘图又一神器ControlNet
人体骨骼关键点检测综述
人体骨骼关键点对于描述人体姿态,预测人体行为至关重要。因此人体骨骼关键点检测是诸多计算机视觉任务的基础,例如动作分类,异常行为检测,以及自动驾驶等等。近年来,随着深度学习技术的发展,人体骨骼关键点检测效果不断提升,已经开始广泛应用于计算机视觉的相关领域。本文主要介绍2D人体骨骼关键点的基本概念和相关算法,其中算法部分着重介绍基于深度学习的人体骨骼关键点检测算法的两个方向,即自上而下(Top-Down)的检测方法和自下而上(Bottom-Up)的检测方法。
SIGAI学习与实践平台
2018/08/07
2.9K0
人体骨骼关键点检测综述
推荐阅读
视频行为识别(一)——综述
1.5K0
最新综述|深度学习的单目人体姿态估计
1.6K0
推荐几篇新出的 CVPR 2021开源论文,含图像分割、域适应、图像检索、视线估计等
1.2K0
遥感领域中无监督域适应综述
1.1K0
25篇最新CV领域综述性论文速递!涵盖15个方向:目标检测/图像处理/姿态估计/医学影像/人脸识别等方向
1.8K0
【首创】新加坡国立大学LV实验室发布多人图像解析数据集与模型
1.6K0
想学图像分割,强烈建议从这5篇图像分割算法综述
3.4K0
基于深度学习的单目人体姿态估计方法综述(一)
1.7K0
工业缺陷检测深度学习方法综述
1.8K0
ECCV 2018 | 中山大学&商汤提出部分分组网络PGN,解决实例级人体解析难题
1.7K0
CV Code|计算机视觉开源周报20200602期~文末送书
8190
深度学习行人重识别综述与展望,TPAMI 2021 最新文章
2K0
重磅综述!离群_异常_新类检测?开集识别?分布外检测?一文搞懂其间异同!
7441
CV Papers|计算机视觉论文推荐周报20200601期
6560
南大清华发布《从单目图像中恢复三维人体网格》综述论文,涵盖246篇文献全面阐述单目3D人体网格恢复研究进展
1K0
AI综述专栏 | 步态识别的深度学习综述
3.7K0
综述!基于图的时间序列异常检测方法
6660
AI论文速读 |2024[TPAMI]【综述】自监督学习在时间序列分析的分类、进展与展望
2830
7 Papers & Radios | 一块GPU跑ChatGPT体量模型;AI绘图又一神器ControlNet
6580
人体骨骼关键点检测综述
2.9K0
相关推荐
视频行为识别(一)——综述
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档