试图找出如何使用MPSCNNConvolution
。我有一个4x3图像和一个4x3内核。我把所有的权重设为1,把所有的输入设为1,这样我就可以得到所有的1。我得到的反而是
12 9 6 3
8 6 4 2
4 3 2 1
问题是我不知道它是否应该这样做。我已经翻遍了所有我能找到的苹果文档,每一篇在线文章,每一个github回购,我找不到任何东西可以说明当这个层被正确设置时会期望什么样的输出。
这种模式适用于不同大小的图像。3x2给了我
6 4 2
3 2 1
一个2x2给了我
4 2
2 1
我已经将我的“最小”示例推到了github上。不是很小。Xcode 12.4不再支持Float16,因此有在Float16和Float32之间浮动的实用代码,再加上所有卷积的复杂设置,还有更多的代码用于尝试不安全指针。
我的具体问题是:这是MPSCNNConvolution
的“正常行为”吗?这个函数/算法有名字吗?我能查到什么吗?
发布于 2021-03-16 20:05:55
MPSCNNConvolution
的文档有点混乱。对于不熟悉的人来说,MPSCNNConvolution
似乎是一种容纳卷积核的容器。事实并非如此。MPSCNNConvolution
本身就是一个内核。具体来说,它对内核窗口下的所有输入值进行加权和求和。只是一个直接的和,没有平均或最大。您所看到的结果是内核从(0,0)开始,然后从右边缘滑出,最后从底部边缘滑出。
在输入图像上设置内核偏移量和剪辑矩形,MPSCNNConvolution
将与MPSCNNPooling*
内核和所有其他内核一样工作。
https://stackoverflow.com/questions/66057742
复制相似问题