定义一个锚点(anchor) x,有个正例x+和一个负例x-,所以目标函数就是要最小化x和x+的距离,最大化x和x-的距离,定义如下所示:
Lifted Structured Loss
该loss为了更好的计算效率...1个正样本和N-1个负样本,N-pair loss定义如下所示:
NCE
NCE本身是统计模型做参数估计的方法,思想就是用罗杰斯特回归来区分数据和噪声.非噪声样本的概率用P表示,噪声样本的概率用q表示...InfoNCE
受到NCE的启发,InfoNCE使用了交叉熵损失,用在一个正样本和一系列噪声样本上.给定一个上下文环境c,我们可以得到条件概率p(x|c),N-1的负样本直接从概率分布p(x)提取,独立于...我们有个样本集合X = {xi},i=1~N, 其中只有一个正样本x_pos, 我们能得到下式
f(x,c)就是模型的打分函数,所以InfoNCE loss优化log loss,如下式:
Soft-Nearest...Neighbors Loss
该loss扩展到包含多个正样本,假设有个batch {xi, yi} i = 1~B, 该loss会有个温度系数控制,如下所示:
温度τ用于调整特征在表示空间中的集中程度