我在github上浏览了一些代码,发现了一个名为ConvLSTM2D
的Keras
层。Keras
文档声明It is similar to an LSTM layer, but the input transformations and recurrent transformations are both convolutional.
。
我想知道这一层的实际应用是什么。我对NLP很熟悉,我还没有看到这个层被使用过。
机器学习的哪个领域/深度学习利用了这一层?
发布于 2018-03-24 18:52:36
ConvLSTM2D层用于解决时空问题的计算机视觉问题,即需要提取空间特征和时间相关性的问题。请参阅ConvLSTM文件
它解释了完全连接的LSTM可以捕获时间相关性,但不对空间数据进行编码。这就是为什么他们提出了一个模型,其中对状态的输入和状态到状态的转换是卷积的。
我可以找到一些论文,其中ConvLSTM是自然视频序列预测、手势识别和视频分类模型的一部分,也就是我们想学习时空数据的地方。
发布于 2019-08-01 06:59:10
正如user239457所说,是为了提取时间和空间依赖的特征(实际上,他引用了首次提出ConvLSTM层的文章)。
那么,我们每天消费什么样的信息,时间和空间是相关的呢?是的,你猜对了:视频。
从这个意义上讲,还有其他深度学习领域使用这一层:
如果您对此感到好奇,可以使用一个轻量级数据集来学习对象跟踪的基础知识:移动MNIST。
https://stackoverflow.com/questions/49468918
复制相似问题