输出变量 y 在所有的任务上具有相同的语义;输 入变量 x 在每个任务(或者,比如每个用户)上具有不同的意义(甚至可能具有不同的维度),图 上三个任务为 x(1),x(2),x(3)。...在所有这些情况下,目标是利用第一个设定下的数据优势,提取在第二种设定 中学习时或直接进行预测时可能有用的信息。表示学习的核心思想是相同的表示可 能在两种设定中都是有用的。...两个设定使用相同的表示,使得表示可以受益于两个 任务的训练数据。...在迁移学习阶段,仅需要一个标记样本来推断表示空间中聚 集在相同点周围的许多可能的测试样本的标签。...., 2014):我们已经知道一种语言中的单词,和非语言语料库中学 到的词与词之间的关系;另一方面,我们已经翻译了一种语言中的单词与另一种语 言中的单词相关的句子。