我有一个327帧的序列,尺寸为480行,640列,灰度。打印(X_train.shape)给出:(327480640,1) 我有以下模型: N = 2 #number of frames to distribute... print (model.output_shape)给出:(None,2,480,640,32) 我还需要一个维度来将此输入传递给卷积
我在看这个层层打印出来的照片。我意识到,这显示了输入/输出,但与如何处理RGB通道无关。如果你看block1_conv1,上面写着"Conv2D“。但是如果输入是224 x 224 x3,那就不是2D了。
我更大、更广泛的问题是,在整个培训过程中,如何处理3通道输入(我认为这是VGG16)。RGB通道是否在某个时候合并(求和或连接)?何时何地?还是模型从端到端分别运行在不同的通道/颜色表示上?