我正在训练CNN架构,用PyTorch来解决回归问题,其中我的输出是20个值的张量。我计划用RMSE作为模型的损失函数,并尝试使用PyTorch的nn.MSELoss(),并使用torch.sqrt()作为平方根,但在得到结果后感到困惑,我会尽力解释原因。很明显,对于批处理大小的bs,输出张量的维度将是[bs , 20].I试图实现的,并由我自己实现RMSE函数:
def l
当使用具有多个输出的神经网络时,通常建议采取什么最佳策略来尽早停止训练过程?鉴于我目前正在监视净验证损失(来自n个不同输出神经元的验证损失加在一起),并且注意到我的训练在一个或多个损失收敛之前就停止了,我想知道在这种情况下的最佳实践是什么。如果一个人监视净验证损失,或者是否有任何方法实现早期停止,使m out n (m从1到n)输出的验证损失被监视,并且在某一阈值内的</e