我使用一个由GRU单元组成的RNN来比较两个包围盒的轨迹,并确定它们是否属于同一个代理。换句话说,我只对最后一步的概率得分感兴趣。
在这种情况下,我不确定如何构造损失函数。我认为有两种选择:
1)强迫网络在每一时间步骤输出正确的标签,即如果我提供一个输出应为1的正训练样本,那么我的损失函数将是网络输出在每个时间步骤减去的向量。
2)只检查最后一步的输出,只使用损失函数中的输出。
从直觉上看,第二种选择更有意义,但我相信还有其他因素在起作用。
发布于 2018-07-09 04:11:33
第二个选择是好的选择。
如果我是你,我会尝试在RNN层和最后一个输出之间放置一个密集的层。不要忘记对最后一层使用softmax激活函数来获得概率。
https://datascience.stackexchange.com/questions/34189
复制