首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【图像分类】简述无监督图像分类发展现状

    无监督图像分类问题是图像分类领域一项极具挑战的研究课题,本文介绍了无监督图像分类算法的发展现状,供大家参考学习。 作者 | 郭冰洋 编辑 | 言有三 1 简介 ?...在这一背景下,有关无监督图像分类的研究也变得愈发火热,大致可以分为数据集变换和聚类分析两种方向,本文将围绕两种方向对无监督图像分类的研究现状展开介绍,从以供各位读者参考。...IIC-CNN通过对CNN稍作改动,构建两个输入分支,为了做到无监督,模型对每张图片x做一次转换操作( 平移、旋转或crop )得到另一张图片 x’。输入转换图像的分支作为辅助层直接进行聚类训练。...4 总结 现阶段,基于深度学习的无监督图像分类研究尚处于发展阶段,加之问题的难度较大,其研究成果相较于其他方向较少,同时也仅在某些简单的数据集上进行实验,并未真正大规模的应用到实际场景。...因此,为了更好的使无监督图像分类得到广泛的应用,我们必须探究传统算法的优势,紧密结合神经网络的特点,提出更多更有创意的思路,以实现更大的突破。

    2K31

    真·无监督!延世大学提出图像到图像无监督模型,实验结果超SOTA

    后者往往被称为“无监督”,而这种方法还有一个重要的假设:域标签是先验的。...为了估计域标签,作者还采用了一种能够最大化图像的域分配与其增强版本之间相互信息(mutual information)的无监督方法。这有助于引导网络将相似的图像分组在一起,并同时均匀地分隔类别。...在这一部分中作者使用无监督聚类方法自动产生给定图像的域标签,也就是前面所说的最大化图像的域分配与其增强版本之间相互信息。...3 实验结果 在实验部分,一共进行了三个,分别是分析目标函数和训练策略的效果、在三个未标记的数据集上进行无监督的图像到图像的翻译、在半监督监督环境下与最先进的(SOTA)技术的比较。...作者为了研究所提出的方法能够处理无监督的图像到图像的翻译,在AFHQ、FFHQ和LSUN CAR数据集上对模型进行了评估。

    1.1K20

    Paper | CVPR 2019 Image Caption 之 无监督图像描述

    然而,现有的大多数模型严重依赖于成对的图像-句子数据集,这些数据集的获取成本非常高。 在本文中,我们首次尝试以无监督的方式训练一个图像字幕模型。...鉴于现有的句子语料库主要用于语言研究,很少对应图像内容,我们抓取了200万个描述图像的自然句子,以方便无监督Image Caption场景。...(f)是我们提出的无监督方法(首次提出无监督的ImageCaption)。 图1....如果将图像作为源语言,那么无监督图像描述任务在本质上与无监督机器翻译相似。...然而,无监督图像描述任务更具挑战性,因为图像和句子处于两种显著不同的模式中。 模型结构 图2.我们的无监督模型架构,包括一个图像编码器,一个句子生成器,和一个鉴别器。

    72620

    KonX:跨分辨率的无参考图像质量评价

    例如,在分类任务中,对象标签应该在不同尺度上保持不变,但不同尺度的图像会给模型预测带来一定的偏差;对于ground-truth随着图像尺度变化而变化的任务,如图像质量评价任务来说,尺度不变性问题将会更加的重要...在图像质量评价(IQA)中,降采样可以减弱损伤,如模糊或压缩伪影,从而提高主观实验中的人类感知质量分数。...KonX 对三种不同分辨率的图像进行了主观标注,作为IQA模型的基准,强调了注释的可靠性。 KonX 包括210张来自 Flickr 的图像和210张来自 Pixabay 的图像,以补充高质量的范围。...图像采用基于离散元数据和其他图像属性的分层方法进行采样,以达到丰富多样化内容和感知质量水平的目的。...它由两列的 MLSP block 组成,这两个 block 都在 ImageNet-1000 上用 600x600px 大小的图像预训练,并使用 512x384px 和 1024x768px 的图像进行微调

    93910

    用这种方法实现无监督端到端图像分类!

    这就需要在无监督的情况下对互联网级别的数据集进行训练的方法。 无监督学习在机器学习社区 [12] 中得到了广泛的研究,在计算机视觉应用中也经常使用聚类、降维或密度估计算法 [13,14,15]。...虽然它有助于理解标签对网络性能的影响,但是 ImageNet 有一个基于细粒度图像分类挑战的特定图像分布集:它由均衡的类组成,例如包含各类犬种。...最后,目前的基准测试侧重于无监督卷积网络捕捉类级信息的能力。研究者还建议在图像检索基准上对它们进行评估,以测量它们捕捉实例级信息的能力。...滤波器的可视化是通过学习一个输入图像来获得的,该图像最大化目标滤波器的响应 [64]。 ?...图 5:来自 YFCC100M 的 1000 万个图像的随机子集中的前 9 个激活图像,用于最后卷积层中的目标滤波器。顶行对应的是对包含物体的图像敏感的滤波器。底行展示了对风格效果更敏感的滤波器。

    1K10

    Double DIP —— 一种无监督层图像分割 AI 技术

    “基于耦合的深度图像先验网络对单个图像进行无监督层分割” AI 科技评论按:每月《Computer Vision News》都会选择一篇关于计算机视觉领域研究成果的论文进行回顾。...在该论文中,作者提出了一种基于耦合的「深度图像先验」(DIP)网络对单个图像进行无监督层分割的统一框架。...作者向我们展示了该方法在各类计算机视觉任务上的运用,比如:水印去除,前景/背景分割,图像去雾以及视频中的透明度分离等。...关于「图像分割的统一框架」 由三个不同任务重新定义的原图分割,可以视为简单基本层的混合,如下图所示,图像分割、图像去雾、透明度分离这三种任务都可以看作是,先把原始图像拆分成一些基本层,然后再把这些层重新混合...Double-DIP 能够基于无监督的层分割获得高质量的分割,如图 4 所示,更多图像分割结果可以在该项目的网站上进行观看。

    1K30

    实习期完成,无图像对和域标签,博士小哥实现完全无监督的图像转换

    因而,越来越多的研究人员开始探索无监督设置下的图像到图像转换方法。2019 年 5 月,英伟达的一项研究探索 few-shot 无监督的图像到图像转换算法,并实现了逼真的转换效果。...论文链接:https://arxiv.org/pdf/2006.06500.pdf 代码地址:https://github.com/clovaai/tunit 那么研究者是如何实现无监督的图像到图像转换呢...论文详解请戳: 如何实现的 首先,研究者阐明,本文中的无监督图像到图像转换属于无任何监督的任务,也就是没有图像级和集合级监督。...不带任何标签的图像到图像转换 为了证实该方法能够处理无监督情况下的图像到图像的转换,研究者分别在 AFHQ、FFHQgaimoxi 和 LSUN Car 数据集上对模型进行了评估。 ?...图 7:无监督情况下,在 AFHQ 上的图像到图像转换结果。 ? 图 8:无监督情况下,在 FFHQ 和 LSUN Car 上的图像到图像转换结果。

    43120

    【无监督学习最新研究】简单的「图像旋转」预测,为图像特征学习提供强大监督信号

    例如,在PASCAL VOC 2007检测任务中,我们的无监督预训练的AlexNet模型达到了54.4%的 最先进的性能表现(在无监督的方法中),比监督学习的情况下仅少了2.4个百分点。...我们自监督特征学习方法的核心观念是,如果一个人对图像中描述的对象没有概念,那么他就不能识别应用于它们的旋转 因此,最近人们对以无监督的方式学习高级的基于卷积神经网络的表征越来越感兴趣,这种方式避免了对视觉数据的手动注释...其他成功的无监督特征学习案例是基于聚类的方法、基于重构的方法,和学习生成概率模型的方法。 ?...因此,为了实现无监督的语义特征学习,正确地选择这些几何变换是至关重要的。我们提出的是将几何变换定义为0°、90°、180°和270°的图像旋转。...我们在各种无监督和半监督条件下对我们的方法进行了详尽的评估,并且在测试中实现了最先进的性能。

    1.8K60

    基于单目图像无监督学习的深度图生成

    01 论文的主要思想 如图1所示,网络的输入只需左相机图像,在训练阶段通过左右相机图像作为监督。...注意,这里的无监督学习指的是,不需要深度图作为监督,但仍需左右相机图像对网络进行监督,采集数据时,仍需要采集左右相机图像。 ?...然后通过图2的操作,并根据右视差图+左图像,可以重建出右相机图;同样,根据左视差图+右相机图像可以重建出左相机图,前期在训练阶段,输入只有左相机图,以左相机图和右相机图作为标签,参与到上述的计算中,这样做的意义是...其实这个就是重建出来的左右图像和真实的左右相机图像的损失函数,注意,文中说到的无监督只是说没有真实的深度信息作为标签,并不是没有真实左右相机图像。...这个其实是左右视差图的差异损失,从左图像恢复出的视差图和从右图像恢复出的视差图理论上应该是一样的,但是会有一些微小的差异,这里也是做了一个监督,使左右视差图生成的视差近似相同,也是为了后面直接从左相机图像生成左右视差图做了一个监督

    62320

    基于单目图像无监督学习的深度图生成

    论文的主要思想 如图1所示,网络的输入只需左相机图像,在训练阶段通过左右相机图像作为监督。...注意,这里的无监督学习指的是,不需要深度图作为监督,但仍需左右相机图像对网络进行监督,采集数据时,仍需要采集左右相机图像。 ?...然后通过图2的操作,并根据右视差图+左图像,可以重建出右相机图;同样,根据左视差图+右相机图像可以重建出左相机图,前期在训练阶段,输入只有左相机图,以左相机图和右相机图作为标签,参与到上述的计算中,这样做的意义是...其实这个就是重建出来的左右图像和真实的左右相机图像的损失函数,注意,文中说到的无监督只是说没有真实的深度信息作为标签,并不是没有真实左右相机图像。...这个其实是左右视差图的差异损失,从左图像恢复出的视差图和从右图像恢复出的视差图理论上应该是一样的,但是会有一些微小的差异,这里也是做了一个监督,使左右视差图生成的视差近似相同,也是为了后面直接从左相机图像生成左右视差图做了一个监督

    94620

    无需成对示例、无监督训练,CycleGAN生成图像简直不要太简单

    图像到图像的转换涉及到生成给定图像的新的合成版本,并进行特定的修改,例如将夏季景观转换为冬季。 训练图像到图像的转换模型通常需要一个大的成对数据集。...CycleGAN 是一种无需成对示例便可自动进行图像到图像转换的技术。这些模型是采用一批无需关联的来自源域和目标域的图像,以一种无监督的方式训练的。...CycleGAN 是一种通过 GAN 架构训练的无监督图像翻译模型的技术,采用来自 GAN 两个不同领域的非成对的图像集合。...架构模型 CycleGAN 的应用 CycleGAN 的操作建议 图像到图像转换的问题 图像到图像的转换是一个图像合成任务,它要求生成一个对给定图像受控修改后的新图像。...图像到图像的转换是一种视觉图形问题,其目的是使用对齐图像对的训练集,学习输入图像和输出图像之间的映射。

    2.8K10

    论文Express | 英伟达最新:多模态无监督图像迁移网络框架

    用一张猫咪的图像生成老虎、狮子或者豹子等其他猫科动物的图像! 用一张猫咪的图像生成小柯基、萨摩耶或者二哈的图像!...当然你也可以用豹子的图像生成萨摩耶、二哈或者小柯基的图像…… 这种连PS大师都没见过的方法就是由康奈尔大学的Xun Huang(他同时在英伟达实习)等人提出的多维无监督图像迁移网络框架实现的。...在大数据文摘后台回复“迁移”下载论文~ 以下是论文部分内容,文末有代码链接哦~ 无监督图像迁移网络是计算机视觉领域的一个技术难题,即给定一张源域图像,如何在没有其他图像样本的情况下,学习相应目标域图像的条件分布...因此,本文提出了一种多维无监督图像迁移网络框架。 本文中假定代表图像可以被分解成域不变的内容代码,并能捕获特定于域的属性。...▲动物图像迁移 视频中,该模型成功的实现了一类动物向另一类动物的图像迁移。当输入一张给定图像时,可以生成多种迁移图像。生成的迁移图像中动物的形状发生了明显的改变,但是它们的表情保持一致。

    68020

    无监督学习图像特征,取得最先进结果

    CapsNet 作者 Sara Sabour 联合 Geoffrey Hinton 及牛津大学研究者在最新的论文《Stacked Capsule Autoencoders》中提出胶囊网络的改进版本,该胶囊网络可以无监督地学习图像中的特征...同样是使用神经编码器,通过推断部件及其仿射变换,可以直接从图像中发现具体的部件。换句话说,每个相应的解码器图像像素建模,都是仿射变换部分做出的混合预测结果。...最后,该成果在 SVHN 上获得了最先进的无监督分类结果 (55%),同时在 MNIST 上获得了接近最先进的分类结果。(98.5%)。 ?...PCAE 负责将图像分割成组件,借此推断其姿势,并将图像像素重构为转换后的部件模板像素的混合产物;OCAE 则试图将发现的部件及其姿势组成更小的一组对象,再结合针对每个部件的混合预测方案来解释部件的姿势...尽管训练目标不涉及分类/聚类,但 SCAE 依然是唯一一个在无监督对象分类任务中不依赖于互信息(MI)中也能获得有竞争力结果的方法。

    49220
    领券