Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大会 | CVPR 2018论文解读:真实监控场景中的异常事件检测

大会 | CVPR 2018论文解读:真实监控场景中的异常事件检测

作者头像
AI科技评论
发布于 2018-03-29 09:24:29
发布于 2018-03-29 09:24:29
2.9K2
举报
文章被收录于专栏:AI科技评论AI科技评论

AI 科技评论按:本文为上海交通大学林天威为 AI 科技评论撰写的独家稿件,未经许可不得转载。

安防作为近年最热门的计算机视觉研究落地方向,与视频分析研究有着很紧密的关系。在真实的监控视频中,一个常见的需求就是要自动识别视频流中的异常事件,也就是异常事件检测任务(Anomaly detection)。

这个任务有许多的难点,比如:

1.异常事件发生的频率很低,导致数据的收集和标注比较困难;

2.异常事件的稀少导致训练中的正样本远少于负样本;

3.在监控场景中,不管是通常(normaly)还是异常(anomaly)事件都是很多样且复杂的,即类别内的多样性很高,variance 很严重。

最近 UCF 的 CV 研究中心就在 CVPR18 上发表了一篇关于监控视频异常事件检测的论文,提出了一种基于深度多实例排序的弱监督算法框架,同时提出了一个新的大规模异常事件检测数据集。这篇笔记主要对这篇文章进行介绍,也算是帮助自己理解,若有错误烦请指正。

本文提出的异常检测算法

很多先前的方法都先学习一个通常的模式,并假定任何违背这个通常模式的 模式应该是异常的。但事实上,一个方法很难也几乎不可能去定义一个所谓的通常模式,因为通常模式里面可能包含太多不同的事件和行为了。同样,也很难去定义异常事件,因为异常事件同样也可能包含太多类型的情况了。所以,这篇文章主要提出了两点 motivations。

1.异常事件检测任务应该要在弱监督框架下进行学习。此处弱监督指在训练时,只知道一段视频中有或没有异常事件,而异常事件的种类以及具体的发生时间是未知的。

2.异常事件检测任务应该采取两阶段的框架,即不管异常事件的种类,生成异常事件的 proposal,之后再对 proposal 中包含的异常事件进行分类。这样有助于提高异常事件检测的召回率(应该是因为这样可以找到一些不在现有类别中的异常)。这样的框架和目标检测中的 RCNN 类方法十分相似。这篇文章则主要针对异常 proposal 阶段进行研究。

基于这样的想法,该文采用了多示例学习(Multiple instance learning, MIL)方法来构建算法框架,并提出了包含 稀疏和平滑约束的 MIL 排序损失来训练模型。算法框架如下图所示,主要使用 MIL 的思路构建训练集合,使用 C3D+FC 的网络来获取异常评分,最后采用提出的 MIL 排序损失来训练模型。

多示例学习(Multiple Instance Learning)

首先简单的介绍一下多示例学习,这是在 20 世纪 90 年代在机器学习领域中提出的方法。在 MIL 中,「包」被定义为多个示例的集合,其中「正包」中至少包含一个正示例,而「负包」中则只有负示例(此处示例的概念与样本相同,以下不区分)。MIL 的目的是得到一个分类器,使得对于待测试的示例,可以得到其正负标签。可以看出,在异常检测任务中,弱监督实际上就是 MIL 的另外一种表达形式,所以 MIL 的求解算法很适合用于该弱监督任务中。多示例学习的更多介绍可以参考这篇博客:

多示例学习(Multiple Instance Learning) http://blog.csdn.net/loadstar_kun/article/details/22849247

深度MIL排序模型

接下来介绍该文提出的算法。文中将异常检测定义为一个回归任务,即异常样本(anormal)的异常值要高于通常样本(normal)。直观的考虑可以将排序损失定义为:

此处 Va 和 Vn 分别为异常和通常样本,f则为模型预测函数。由于在 MIL 中,并不知道正包中每个样本的真实标签,所以采用以下的形式:

此处即指,在训练中对于正包和负包都只使用分数最大的样本来训练。具体而言,正包中分数最大的样本最可能是正样本,而负包中分数最大的样本则被认为是 hard negative,即难例。基于此式,为了让正负样本之间的距离尽可能远,作者采用了 hinge-loss 的形式。

但这样的 loss 并没有考虑视频的时序结构,所以作者提出了两点改进的 motivation:

1.由于视频片段是连续的,所以异常的分数也应该是相对平滑的。

2.由于正包中的正样本(异常事件)比例是很低的,所以正包里面的分数应该是稀疏的。

基于这两点 motivation,作者在 loss function 中添加了两个约束项,分别为时序平滑约束以及稀疏约束。如下所示。

最后,再添加上模型参数的 l2 正则,就得到了最后的损失函数。

实现细节

在具体实现中,本文采用了在其他数据集上预训练好的 C3D 模型来提取视频片段的特征,此处不对 C3D 模型进行训练。对提取好的特征,再使用 3 层全连接层来获得最后的预测异常值。以上提出的 MIL 排序损失也是用来对这几层 FC 层训练的。

在训练数据处理方面,该文将每个视频均匀分为 32 个片段,作为一个包。训练时,随机选取 30 个正包和 30 个负包作为 mini-batch 进行训练。

本文提出的异常检测数据集

本文的另外一个贡献是提出了一个新的较大规模的异常事件检测数据集 UCF-Crime,参考下表,该数据集比起之前的数据集的优点主要是两方面:一是视频的数量和视频的总时长要远远多于之前的数据集,二是其中包含的异常事件类型比较丰富。

在数据集构成方面,该数据集共包含 13 种异常事件。共有 1900 个视频,其中异常和通常视频各占 950 个。数据集划分方面,训练集包含 1610 个视频(800 个通常视频,810 个异常视频),测试集包含 290 个视频(150 个通常,140 个异常视频)。

数据集网址及该论文项目页见:

Real-world Anomaly Detection in Surveillance Videos http://crcv.ucf.edu/cchen/

实验结果

方法比较

本文主要以 ROC 曲线下的 AUC 来衡量异常检测算法的效果,其实验结果如下图和下表所示。可以看出,其算法比起之前的方法还是有很大的提高的。此外,添加训练中的约束项也带来了一定的效果提升,不过不是很明显。

下图则是一些可视化的结果,可以看出在作者挑选的这些例子中,异常检测的效果还是很不错的,最右一列则为一些失败案例。

虚假预警率分析

在监控任务场景中,一个可靠的系统应该具备较高的召回率和较低的误报率,作者比较了0.5阈值下的误报率,也具备不错的效果。

异常事件分类

该文的方法只是做异常事件 proposal,但该文的数据集实际上还能做异常时间分类任务,所以此处作者还用 C3D 和 TCNN 两种行为识别算法跑了一个 baseline,可以看出此处 TCNN 的效果还是比 C3D 要好很多。

小结与讨论

这篇文章主要针对异常事件检测问题提出了一种新的弱监督算法和一个新的数据集。算法方面,主要就是将这个问题套用进了 MIL 的框架。这个数据集的提出应该对这个方向的发展会有比较大的帮助,此前异常检测一直没有比较大的数据集。

缺点方面,我认为对于异常检测这种数据不平衡任务,用 PRC 曲线会比 ROC 曲线能更好得起到衡量算法效果的作用。即应该用 Average Precision 来衡量异常检测效果。另外文中还着重衡量了虚报率,而在真实场景中对于异常事件的召回率要更重要一些,毕竟漏过几个异常事件比起虚报几个异常事件带来的负面影响更大。

总的来说,异常事件检测作为真实场景中一个非常重要的任务,目前针对性的研究还不是很多。基于这篇文章提出的算法思路和数据集,后面应该也会有更多的工作跟进吧。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
2 条评论
热度
最新
多示例学习,很有意思,谢谢分享!
多示例学习,很有意思,谢谢分享!
回复回复点赞举报
大规模视频的异常事件检测,有两个前提,如果其中一个前提不成立,公式中的约束撤掉,是不是效果就没有这样好了。
大规模视频的异常事件检测,有两个前提,如果其中一个前提不成立,公式中的约束撤掉,是不是效果就没有这样好了。
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
AAAI-2024 | VadCLIP: 首个基于视觉-语言模型的弱监督视频异常检测方法
本文分享论文VadCLIP: Adapting Vision-Language Models for Weakly Supervised Video Anomaly Detection,该论文已被 AAAI 2024 接收,代码和相关CLIP特征已开源。
CV君
2023/12/26
1.4K0
AAAI-2024 | VadCLIP: 首个基于视觉-语言模型的弱监督视频异常检测方法
【时间序列】时间序列的智能异常检测方案
时间序列异常检测是学术界和工业界一直研究的热点和难点问题。比如腾讯内部开源的Metis项目,其实现思路是基于统计判决、无监督和有监督学习对时序数据进行联合检测。通过统计判决、无监督算法进行首层判决,输出疑似异常,其次进行有监督模型判决,得到最终检测结果。检测模型是经大量样本训练生成,可根据样本持续训练更新。Metis实现的时间序列异常检测学件在织云企业版本中已覆盖 20w+ 服务器,承载了 240w+ 业务指标的异常检测。经过了海量监控数据打磨,该学件在异常检测和运维监控领域具有广泛的应用性。
roganhuang
2020/07/29
23.4K2
【时间序列】时间序列的智能异常检测方案
用深度学习实现异常检测/缺陷检测
创建异常检测模型,实现生产线上异常检测过程的自动化。在选择数据集来训练和测试模型之后,我们能够成功地检测出86%到90%的异常。
Color Space
2021/02/07
3.2K0
CVPR 2019 | 基于级联生成式与判别式学习的乳腺钼靶微钙化检测
该论文由深睿医疗与北京大学王亦洲课题组合作,是其自研算法在智慧医疗领域的应用,针对乳腺钼钯中的微钙化(直径<= 1 cm)检出问题提出了结合生成式和判别式模型的新思路。钙化检测对于乳腺癌的早期诊断十分关键,根据美国放射学院第五版 BI-RADS 标准,可疑恶性钙化点通常直径在 1 cm 以内。因此,研究微钙化的检出算法具有重要的临床意义。
机器之心
2019/05/15
6740
CVPR 2019 | 基于级联生成式与判别式学习的乳腺钼靶微钙化检测
【CVPR智慧城市挑战赛】无监督交通异常检测,冠军团队技术分享
【新智元导读】“智能交通视频分析界的ImageNet竞赛”——英伟达城市挑战赛落下帷幕。新加坡松下研究院联合中科院自动化所,提出了一种双模态动静联合检测方案,在交通异常检测比赛中拔得头筹,获得了很高检测准确度的同时保持了极低的检测时间误差。由于提出的方案具有准确度高,鲁棒性强,对数据的分辨率敏感度低等优点,可以作为真实场景下的异常检测的一种可靠的解决方案。
新智元
2018/07/31
2.4K0
【CVPR智慧城市挑战赛】无监督交通异常检测,冠军团队技术分享
基于OpenVINO实现无监督异常检测
异常检测(AD) 在欺诈检测、网络安全和医疗诊断等关键任务应用中至关重要。由于数据的高维性和底层模式的复杂性,图像、视频和卫星图像等视觉数据中的异常检测尤其具有挑战性。然而,视觉异常检测对于检测制造中的缺陷、识别监控录像中的可疑活动以及检测医学图像中的异常至关重要。
Color Space
2024/06/04
8910
基于OpenVINO实现无监督异常检测
探索LightGBM:监督式聚类与异常检测
监督式聚类和异常检测是在监督学习框架下进行的一种特殊形式的数据分析技术。在Python中,LightGBM提供了一些功能来执行监督式聚类和异常检测任务。本教程将详细介绍如何使用LightGBM进行监督式聚类和异常检测,并提供相应的代码示例。
Echo_Wish
2024/02/27
2940
使用孤立森林进行异常检测
异常检测是对罕见的观测数据进行识别,这些观测数据具有与其他数据点截然不同的极值。这类的数据被称为异常值,需要被试别和区分。造成这些异常现象的原因有很多:数据的可变性、数据收集过程中获得的错误,或者发生了一些新的、罕见的情况。
deephub
2021/04/16
2.7K0
时序异常检测 Anomaly transformer
a)学习时序数据点级别的表征,进而依靠重构或预测误差进行判定,例如RNN; b)通过图以显式关联建模,将具有不同时间点的时间序列表示为顶点,并通过随机游走检测异常。例如GNN。
数据STUDIO
2023/09/04
1.2K0
时序异常检测 Anomaly transformer
第十六章 异常检测
在接下来的一系列视频中,我将向大家介绍异常检测(Anomaly detection)问题。这是机器学习算法的一个常见应用。这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。
tomas家的小拨浪鼓
2019/03/19
8780
第十六章 异常检测
异常检测怎么做,试试孤立随机森林算法(附代码)
从银行欺诈到预防性的机器维护,异常检测是机器学习中非常有效且普遍的应用。在该任务中,孤立森林算法是简单而有效的选择。
用户8949263
2022/05/25
1.2K0
异常检测怎么做,试试孤立随机森林算法(附代码)
吴恩达机器学习中文版笔记:异常检测(Anomaly Detection)
作者:黄海广 在接下来的一系列视频中,我将向大家介绍异常检测(Anomaly detection)问题。这是机器学习算法的一个常见应用。这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。 问题的动机 参考文档:15-1-Problem Motivation(8 min).mkv 在接下来的一系列视频中,我将向大家介绍异常检测(Anomaly detection)问题。这是机器学习算法的一个常见应用。这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,
大数据文摘
2018/05/23
1.1K0
ICCV2021 | 如何高效视频定位?QMUL&北大&Adobe强强联手提出弱监督CRM,性能SOTA
视频活动定位(Video activity localisation)因其在自动定位未修剪和非结构化视频中,根据语言描述定位最显著视觉片段方面的实际价值,获得了越来越多的关注。对于监督模训练,必须对一个句子对应视频段的开始和结束时间进行时间标注。这种标注不仅代价非常大,而且对模糊性和主观注释偏差也很敏感。
CV君
2021/09/27
9990
ICCV2021 | 如何高效视频定位?QMUL&北大&Adobe强强联手提出弱监督CRM,性能SOTA
基于声音信号的工业设备异常检测
异常检测主要目标是将异常事件与正常事件区分开来,因此才有了“异常”一词。本文将介绍基于声音信号的工业机械异常检测,使用的数据集是MIMII声音数据集,该数据集很容易在网上获得。
deephub
2023/08/30
6120
基于声音信号的工业设备异常检测
异常检测原理及其在计算机视觉中的应用
这篇文章涵盖了三件事,首先什么是视觉角度的异常检测?用于异常检测的技术有哪些?它在哪里使用?
小白学视觉
2022/12/27
1.1K0
异常检测原理及其在计算机视觉中的应用
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
近日,ECCV(European Conference on Computer Vision)组委会公布了录用论文名单,共有2395篇论文被录用,录用率27.9%。ECCV,即欧洲计算机视觉国际会议,是计算机视觉领域中最顶级的会议之一,与ICCV和CVPR并称为计算机视觉领域的“三大顶会”。ECCV每两年举行一次,会议内容广泛覆盖了计算机视觉的所有子领域,包括但不限于图像识别、物体检测、场景理解、视觉跟踪、三维重建、深度学习在视觉中的应用等。
公众号-arXiv每日学术速递
2024/07/31
7850
ECCV 2024|腾讯优图实验室14篇论文入选,含工业缺陷异常检测、图文引导图像编辑、多模态标签等研究方向
异常检测最新研究总结(一)
点击上方“AIWalker”,选择加“星标” 精品干货,瞬时送达
AIWalker
2020/12/03
1.6K0
异常检测最新研究总结(一)
[吴恩达机器学习笔记]15非监督学习异常检测4-6构建与评价异常检测系统
Note 对于异常检测问题而言,样本数据集往往是倾斜的,即 标记为 1 异常的数据往往很少,而标记为 0 即正常的数据往往很多 此时使用准确率等方法来进行判断一个模型的好坏往往是不合适的,所以通过 查准率和查全率以及 F1 分数能够很好的分析和判断这个问题
演化计算与人工智能
2020/08/14
1.6K0
[吴恩达机器学习笔记]15非监督学习异常检测4-6构建与评价异常检测系统
CVPR 2018 | 腾讯AI Lab入选21篇论文详解
腾讯AI Lab共有21篇论文入选,位居国内企业前列,我们将在下文进行详解,欢迎交流与讨论。
腾讯技术工程官方号
2018/03/26
2.6K2
机器学习在网络安全中的正确打开方式,你学废了吗?
机器学习模型被越来越多地应用到网络安全领域,如:恶意软件检测、恶意脚本检测、加密流量监控、钓鱼邮件检测等等,机器学习在网络安全中的应用看似越来越广,但实际应用到机器学习技术的产品却很有限,在现网应用时,机器学习并没有表现出离线测试中的优良性能。这种现象的产生与安全场景的特性是分不开的,在安全场景下,带标签的数据往往难以获取、正负样本倾斜较大、攻防技术更新快,这些性质决定了我们不能直接套用在其他领域中机器学习的使用方法。
绿盟科技研究通讯
2019/12/06
1.3K0
机器学习在网络安全中的正确打开方式,你学废了吗?
推荐阅读
相关推荐
AAAI-2024 | VadCLIP: 首个基于视觉-语言模型的弱监督视频异常检测方法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档