首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一文读懂胶囊神经网络

来自 | 博客园 作者 | CZiFan 转自 | 深度学习这件小事 背景 Geoffrey Hinton是深度学习的开创者之一,反向传播等神经网络经典算法发明人,他和他的团队提出了一种全新的神经网络...因此,现在要考虑的是如何在神经网络中建模这些分层关系。在计算机图形学中,三维图形中的三维对象之间的关系可以用位姿表示,位姿的本质是平移和旋转。...更加贴近人脑的思维方式,更好地建模神经网络中内部知识表示的分层关系,胶囊背后的直觉非常简单优雅。...人工神经网络不应当追求“神经元”活动中的视角不变性(使用单一的标量输出来总结一个局部池中的重复特征检测器的活动),而应当使用局部的“胶囊”,这些胶囊对其输入执行一些相当复杂的内部计算,然后将这些计算的结果封装成一个包含信息丰富的输出的小向量...囊间动态路由算法 低层胶囊i 需要决定如何将其输出向量发送给高层胶囊j 。低层胶囊改变标量权重cij ,输出向量乘以该权重后,发送给高层胶囊,作为高层胶囊的输入。

3.6K20

胶囊网络-CapsNet】胶囊网络-CapsNet原理

为什么胶囊网络就能学习到位姿信息? 将同一三维物体从两个不同视角的渲染出图像,作为胶囊网络的输入和输出,目标是图像重构。作者想要证明胶囊网络在处理位置、方向、尺度等方面的优势。...什么是胶囊网络 将神经元替换为胶囊就是胶囊网络。 高层胶囊和低层胶囊之间权重通过dynamic routing获得。...而胶囊网络希望通过一个胶囊能够识别同一类pattern。通过胶囊输出向量的长度代表目标存在的概率估计,向量的方向表示实体的属性。...胶囊计算方式 作者用胶囊输出向量的模长来表示一个胶囊所表征的实体在输入中出现的概率。因此作者采用一个非线性函数对向量进行“压缩”,短向量被压缩到几乎为零,长向量也被压缩到1以下长度。...除了第一层胶囊胶囊sj的全部输入是对预测向量uj|i的加权求和。

1.9K10
您找到你想要的搜索结果了吗?
是的
没有找到

拆解式解读如何用飞桨复现胶囊神经网络(Capsule Network)

卷积神经网络的不足之处 卷积神经网络(CNN)虽然表现的很优异,但是针对于旋转或元素平移等变换后的图片,却无法做到准确提取特征。...胶囊神经网络就显式地建模了这些关系,能更精准的理解输入的图片信息。...下图为胶囊神经网络的位姿辨别效果,和其他模型相比,胶囊网络能辨识上一列和下一列的图片属于同一类,但是CNN会认为它们是不同的物品。 ?...对于每个低层胶囊i而言,其权重定义了传给每个高层胶囊j的输出的概率分布。 3. 加权输入向量之和 这一步表示输入的组合,和通常的人工神经网络类似,只是它是向量的和而不是标量的和。 4....从图中可以看出,虽然胶囊神经网络收敛速度有所不及,但是收敛完成之后更加稳定,CNN+池化层准确率一直处于波动中。 ?

52720

神经网络丨主题周】卷积网络虽动人,胶囊网络更传“神”

他提出了全新的“神经胶囊”理论,这“胶囊”里到底装的是什么“药”呢? 从神经元到神经胶囊 在大计算和大数据的背景下,深度学习大行其道、大受欢迎,究其原因,卷积神经网络的出色表现,可谓居功至伟。...2017年10月,Hinton教授和他的团队在机器学习的顶级会议“神经信息处理系统大会(NIPS)”上发表论文,超越了自己前期的理论研究——反向传播算法(BP),提出了一种全新的神经网络——胶囊网络(CapsNet...神经胶囊的提出 Hinton在批判CNN不足的同时,已然备好了解决方案,这就是我们即将讨论的“胶囊神经网络(Capsule Network,简称CapsNet)。”...神经胶囊理论基础 1 神经胶囊的生物学基础 我们知道,人工神经网络在很大程度上是模仿生物神经网络而来的。作为“仿生派”的代表人物Hinton,他提出的“神经胶囊”,同样受益于脑科学的研究进展。...于是,在人工神经网络中,Hinton提出了一个对应的结构,它就是我们前面提到的神经胶囊。简单来说,神经胶囊是一组被打包的神经元,它们在内部做了大量运算,而后仅输出一个被压缩的结果——一个高维向量。

51210

用 Hinton 的胶囊神经网络来识别空间关系 Part1: CNNs及其缺点

Hinton最近提出的胶囊神经网络也许能帮助我们解决包括这一问题和其他问题。 这篇文章是胶囊神经网络系列教程的一部分。作为第一篇文章,将介绍常规(卷积)神经网络以及它的一些问题。...这和胶囊神经网络的结构相反。 ? 神经网络结构,来自谷歌的文章,是Szegedy,Toshev&Erhan提出的神经网络 卷积神经网络有什么问题?...下面是胶囊神经网络能够改善这些问题的几个要点: Hinton说,胶囊神经网络拥有很少层级的分支结构(网络由以神经元组成的层组成,就是这样),并且这使我们需要将每一层的神经元分组到“胶囊”里面,这种“胶囊...胶囊神经网络会计算一个小特征和大特征的姿态关系(跨越边界和旋转)。 这些信息的丢失会造成空间信息的丢失。 问题2:CNN没有考虑图像的每一部分之间的空间关系。...这对于理解胶囊之间的动态路径选择很重要。 现在我们知道了神经网络的基础以及空间识别的问题,我们可以继续了解最近发展出的解决方式:胶囊神经网络。这将是我们下一篇的主题。请继续收看!

39220

无监督胶囊网络

这是一种为 3D 点云提出的无监督胶囊架构,并且在 3D 点云重构、配准和无监督分类方面优于 SOTA 方法。 理解对象是计算机视觉的核心问题之一。...具体而言,研究者通过排列等变(permutation-equivariant)的注意力计算对象的胶囊分解,并通过训练成对的随机旋转对象来自监督该过程。...公式 (4) 中的解码器基于每个胶囊运行。本研究采用的解码器架构类似于 AtlasNetV2 [13](带有可训练的网格)。不同之处在于本研究通过相应的胶囊姿态转换每个胶囊的解码点云; 回归器 K。...研究者只需连接描述符,并通过 ReLU 激活函数调用一系列全连接层,以回归 P 胶囊定位。...由于本研究的描述符只是近似旋转不变(通过扩展),研究者发现在规范化之后重新提取胶囊描述符β_k 很有用。

54120

Hinton胶囊网络后最新研究:用“在线蒸馏”训练大规模分布式神经网络

论文地址:https://arxiv.org/pdf/1804.03235.pdf 在提出备受瞩目的“胶囊网络”(Capsule networks)之后,深度学习领域的大牛、多伦多大学计算机科学教授Geoffrey...在不相交的数据子集上训练的两个神经网络可以通过鼓励每个模型同意另一个模型的预测来共享知识。这些预测可能来自另一个模型的旧版本,因此可以使用很少被传输的权重来安全地计算它们。...没有任何训练神经网络的算法可以无限扩展,但即使扩展得比分布式SGD的限制多一点,也是非常有价值的。...codistillation算法 实验与结果 为了研究分布式训练的可扩展性,我们需要一个代表重要的大规模神经网络训练问题的任务。...另一个重要的比较是两个神经网络的集成,每个神经网络都有128GPU和同步SGD。

83391

胶囊网络为何如此热门?与卷积神经网络相比谁能更甚一筹?

编译 | AI科技大本营 参与 | 孙士洁 编辑 | 明 明 【AI科技大本营按】胶囊网络是什么?胶囊网络怎么能克服卷积神经网络的缺点和不足?...胶囊网络(Capsule networks, CapsNets)是一种热门的新型神经网络架构,它可能会对深度学习特别是计算机视觉领域产生深远的影响。等一下,难道计算机视觉问题还没有被很好地解决吗?...现今,这些计算机视觉任务都需要不同的卷积神经网络架构,如用于分类的ResNet架构,用于目标检测的YOLO架构,用于语义分析的掩模R-CNN架构,等等。图像由AurélienGéron提供。...是的,我们已经看到了令人难以置信的CNNs,但是: 这些CNNs都接受了数量巨大图像的训练(或重复使用了部分已训练过的神经网络)。CapsNets能通过少得多的训练数据就可很好地完成网络训练。...如果被检测对象发生稍微改变(如移动、旋转、调整大小等),则胶囊将输出相同长度的矢量,但方向稍有不同。这样,胶囊是等变的。 就像常规的神经网络一样,一个CapsNet也是按多个层组织的(见图4)。

1.2K40

ICLR 2019 | 与胶囊网络异曲同工:Bengio等提出四元数循环神经网络

四元数神经网络是流形网络和胶囊网络之外又一种非同构表征架构,也可以看成是实值、复值 RNN 的扩展。实验表明,该网络相比传统的实值 RNN 可以显著减少参数数量,适用于低资源应用。...这也是胶囊网络背后的思想:让每个「单元」输出一个参数向量而不是一个数字。在这里,作者表明,通过将四元数结合到 RNN 或 LSTM 使用的表征中,可以使用更少的参数在语音识别任务中实现更好的性能。...最近的流形网络和胶囊网络也探索了将成组数字创建为独立实体的想法(Chakraborty et al., 2018; Sabour et al., 2017)。...与传统的同构表征相反,胶囊网络和四元网络将特征集捆绑在一起。...与胶囊网络类似,四元数允许 QRNN 通过将多维特征整合和处理为单个实体来编码内部依赖性,而循环操作建模了组成序列的元素之间的相关性。

1.2K20

Hinton胶囊网络后最新研究:用“在线蒸馏”训练大规模分布式神经网络

论文地址:https://arxiv.org/pdf/1804.03235.pdf 在提出备受瞩目的“胶囊网络”(Capsule networks)之后,深度学习领域的大牛、多伦多大学计算机科学教授Geoffrey...在不相交的数据子集上训练的两个神经网络可以通过鼓励每个模型同意另一个模型的预测来共享知识。这些预测可能来自另一个模型的旧版本,因此可以使用很少被传输的权重来安全地计算它们。...没有任何训练神经网络的算法可以无限扩展,但即使扩展得比分布式SGD的限制多一点,也是非常有价值的。...codistillation算法 实验与结果 为了研究分布式训练的可扩展性,我们需要一个代表重要的大规模神经网络训练问题的任务。...另一个重要的比较是两个神经网络的集成,每个神经网络都有128GPU和同步SGD。

1K100

胶囊网络遇到序列推荐

随后,利用设计的序列胶囊网络,将序列模式注入多兴趣提取过程,从而以多粒度方式实现更精确的兴趣学习。 2. 方法 如图所示,MGNM 由两部分组成:用户感知图卷积和序列胶囊网络。...每个胶囊的输出相当于特定的用户兴趣,但是以往的工作缺乏的时间序列信息的考虑。 作者为CapsNet引入序列编码层来修复这个缺陷。...给定 l 级的商品表征,第i个胶囊首先在 H^{(l)} 上执行线性投影,如下所示, Z_i=H^{(l)}W_i 然后,通过截断的正态分布初始化 g=[g_1,......,g_m] ,其中 g_i 是表示商品xi与胶囊相关性的一致性分数。...然后通过softmax函数导出相应动态路由机制的耦合系数 c \in R^d ,公式如下, c=softmax(g) 通过胶囊网络的非线性激活函数得到输出,公式如下,其中 c_j 是上面求得的c中的第

1.1K40

给未来写信——时间胶囊技术(二)

一、问题的提出 时间胶囊最初由May[1]提出,在上文《给未来写信——时间胶囊技术(一)》中,我们介绍了基于hash迭代的时间胶囊。...然而,基于hash迭代的时间胶囊,如果发送方希望接收方花多长时间解密,则自己也必须花多长时间来加密,这在实际应用中显然不合适。...二、基于时间锁谜题的时间胶囊 Rivest等人[2]提出了使用“时间锁谜题”来实现时间胶囊的方法。...其较好的满足了时间胶囊的基本要求。 三、时间胶囊应用 3.1遗嘱 例如,某人可能会提前立下遗嘱,而不愿意过早地暴露其遗嘱内容,担心会引起纠纷。...因此,时间胶囊与存在性证明相结合是必然的。区块链天生就是个良好的无中心/无需可信第三方的存证平台,结合区块链的时间胶囊必定更具应用潜力,学界也提出了一些算法,例如[10-13],建议进一步阅读。

61620

给未来写信——时间胶囊技术(一)

一、物理世界的时间胶囊 物理世界的时间胶囊,是指把物品封存在一个较小的空间(即称为“胶囊”),设定好未来开启的时间,只有到了预定的时间才能开启。...一些设定时间比较长久的时间胶囊大多埋在地下或建筑物地基中。这里,我们介绍两个著名的时间胶囊。...乔布斯时间胶囊已按预定时间于埋藏30年后的2013年挖掘。 二、数字时间胶囊 前面介绍的都是物理世界的时间胶囊。物理世界的时间胶囊靠物理的约束来“保证”打开时间。胶囊中,也可以放置信函、书籍等内容。...如何在数字世界实现时间胶囊,即给未来写信呢?物理的时间胶囊,在打开之前,我们是看不到里面的情况的。数字世界的时间胶囊也应该实现“打开”之前看不到其中的信息!...三、基于hash迭代的时间胶囊 本章讨论可具体实现的时间胶囊算法。

1.2K10

第一版胶囊网络

背景 传统的卷积神经网络因为全连接层会丢失位置空间信息,而池化层又会损失掉一部分信息,所以Hinton提出了胶囊网络,这里我介绍的这篇是以向量为输入输出,后面Hinton还写了一篇文章《matrix capsules...胶囊网络介绍 胶囊网络不再以卷积神经网络中特征图的形式,而是以向量作为输入和输出,向量的长度表示某种目标特征,方向代表目标的存在。整个模型分为encoder和decoder部分。...,每个数字胶囊的激活向量模长说明每个类的实例是否存在,并且用来计算分类损失,上一层的胶囊层和DigitCaps层可以认为是全连接。...整个模型中的特色就在于胶囊网络那一块,在胶囊网络部分需要迭代多次,整个过程可以看作是仿射变换、标量加权求和、非线性激活函数的过程,对于来自浅层的胶囊的输入张量u,主要的过程如下图所示: ? ?...后面Hinton针对mnist数据集,做了重叠的实验,发现胶囊网络对重叠拥挤的场景有较好的识别和解释,同时胶囊网络需要的数据量少,相对于传统卷积神经网络胶囊网络在较少的数据量上也可以实现非常高的正确率,

68810

有关胶囊网络你所应知道的一切

作者 | 一轩明月 编辑 | NewBeeNLP 在使用卷积神经网络(CNNs)解决计算机视觉任务的时候,视角的改变(角度、位置、剪应力等等)很大程度上会造成网络表现的剧烈波动,从而限制了模型的泛化能力...简单起见,设定胶囊网络只有两层。第一层是低维胶囊(简单部件),第二层则是高维胶囊(复杂对象)。通常情况下,低维胶囊是我们所知道的,高维胶囊是要计算的。...感受野(Receptive Field):卷积神经网络特征所能看到输入图像的区域,也就是网络内部的不同位置的神经元对原图像的感受范围的大小 至于路由实现方式则有很多,下面主要介绍两种 路由算法 胶囊间动态路由...(MNIST 上是 10 个类别/高维胶囊) 求解过程分两步: 使用 CNN 抽取低维胶囊 计算高维胶囊 胶囊使用 8 维向量表示,呈现概率对应胶囊数值大小。...低维胶囊集合 对第 个高维胶囊的预测结果 ,将第 层的胶囊表示为 ,低维胶囊是已知条件( ),高维胶囊是要计算内容( ) 算法的主要差别是在路由是怎样进行的。

1K40

全面掌握胶囊网络:从基础理论到PyTorch实战

本文将详细介绍胶囊网络的基础概念,从其背后的动机、核心构建块到数学原理等方面进行深入探讨。我们也会与卷积神经网络进行比较,以便更清晰地展示胶囊网络的优势。...解决方案:胶囊与动态路由 胶囊网络引入了“胶囊”(capsule)的概念。每个胶囊都是一个小型的神经网络,它能够识别特定类型的视觉模式,并且对其存在的概率和姿态参数进行编码。...与传统神经网络中的神经元相比,胶囊具有更高维度的输出和更复杂的内部结构,这使得胶囊能够对输入数据进行更为精细和丰富的描述。...4.2 路由算法 动态路由算法是胶囊网络中至关重要的一部分,其工作方式与传统的神经网络中的前向传播算法有显著不同。...定义胶囊层 首先,我们需要定义一个胶囊层,这通常由多个单独的胶囊组成。每个胶囊都是一个小型神经网络,可以通过标准的全连接层或卷积层来实现。

64521

【论文导读】浅谈胶囊网络与动态路由算法

提出了一个新的神经网络---胶囊网络与囊间的动态路由算法。 上篇文章中提到了动态路由算法,由于没太理解,因此找了原论文并且结合参考文献的4篇博文进行解读,才对胶囊网络与动态路由算法的过程有了一点认识。...背景 2.1 CNN的特性与缺陷 卷积神经网络(CNN)在图像分类上取得了非常显著的效果。...为了与普通神经网络相比,完全可以将胶囊网络的计算看成前向传播的过程。...因此作者在论文中提出使用非线性函数“「squashing」”来替代传统的神经网络的激活函数Relu,这是为了确保短向量可以被压缩至接近0的长度,长向量压缩至接近1的长度,「并且保持向量的方向不变」。...3.1.6 与普通神经网络进行比较 ? 上述胶囊网络与传统的神经网络比较图片来自[4],了解神经网络结构的同学也可以对胶囊网络有更深入的认识,具体的介绍可以看[4]。 两者的计算过程如下所示: ?

1.7K40
领券