相对熵也称为 KL 散度(Kullback-Leibler divergence),相对熵是两个概率分布 P 和 Q 差别的度量。具体来说,P 和 Q 的相对熵是用来度量使用基于 Q 的分布来编码服从 P 的分布的样本所需的额外平均比特数。典型情况下,P 表示真实分布,Q 表示数据的理论分布或者是估计的模型分布。
其中,P(i) 和 Q(i) 分别表示 P 和 Q 的离散概率。当式中出现 0 \ln{0} 时,其值按 0 处理。
其中,p 和 q 分别表示 P 和 Q 的概率密度。
交叉熵是指基于 Q 的分布来编码服从 P 的分布的样本所需要的平均比特数。
其中,P(i) 和 Q(i) 分别表示 P 和 Q 的离散概率。
其中,p 和 q 分别表示 P 和 Q 的概率密度。