我正在使用一个模型(SimCLR)从图像中学习表示。在训练前,模型是针对单个虚拟标签进行训练的。现在我想用8类数据对模型进行微调。当将经过预先训练的模型检查点加载到具有8级头部的尚未经过精细调整的模型时,我遇到了一个ValueError。ValueError: Tensor's shape (2048, 1) is not compatible with supplied shape [2048, 8]
在加载到检查点以对模型进行微调
(使用我自己的令牌程序和数据集)All model checkpoint weights were used when我想知道这是否意味着我从零开始就开始使用“预先训练的重量” of RoBERTa?如果它是从预先训练的权重中训练出来的,那么是否有一种方法可以使用随机启动的权重而不是预先训练的权重?==== 2021/10/26更新的===
我使用蒙面语言建模任务通过以下命令训练