原文题目:Self-supervised Training of Proposal-based Segmentation via Background Prediction
摘要:虽然有监督的目标检测方法取得了令人印象深刻的精度,但它们对外观与训练数据有显著差异的图像的概括能力较差。为了在注释数据昂贵得令人望而却步的场景中解决这一问题,我们引入了一种自我监督的目标检测和分割方法,能够处理用移动摄像机捕获的单目图像。我们的方法的核心在于观察到分割和背景重建是相互关联的任务,并认为由于我们观察到一个结构化的场景,背景区域可以从其周围重新合成,而描述对象的区域则不能。因此,我们将这种直觉编码为一个自我监督的损失函数,我们利用它来训练基于提案的分割网络。为了考虑对象方案的离散性,我们提出了一种基于蒙特卡罗的训练策略,使我们能够探索对象提案的大空间。我们的实验表明,我们的方法能够在视觉上偏离标准基准的图像中产生精确的检测和分割,优于现有的自我监督方法,并接近利用大型注释数据集的弱监督方法。
原文作者:Isinsu Katircioglu, Helge Rhodin, Victor Constantin, Jörg Spörri, Mathieu Salzmann, Pascal Fua
原文地址:https://arxiv.org/abs/1907.08051
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。