上述张量可以用代码表示为:[[[2,3],[3,5],[4,7]],[[3,4],[4,6],[5,8]]].请见示意图:
?
换言之,张量的形成原理为数组嵌套数组。...想象有小型放大镜于较大的图像上从左向右滑动,一遍后再从左边重新开始(如打字机一般)。举例说,该移动窗口仅能识别一截短垂直线。三个暗像素相互堆叠。...这一矩形的宽度和高度由其像素点进行衡量,深度则包含三层,每层代表RGB中的一个字母。这些深度层被称为通道。
我们以输入量和输出量来描述经过卷积网络处理的图像,在数学中以多维矩阵表示为:30x30x3。...该数字将是三个堆叠二维矩阵之一的元素。图像体由这些二维矩阵一起构成。
这些数字是输入卷积网络的最初原始感官特征,卷积网络意在上述数字中寻找显著信号,从而更精确地对图像进行分类。...最大池化仅取图像一个片块的最大值,将之置于存有其他片块最大值的矩阵中,并放弃激活映射图中所载的其他信息。
?
仅保留图像中与各特征(最大值)相关性最大的位置。这些最大值一起构成了一个较低维度的空间。