, 关键是如何找到最优的阈值?...图片TensorRT 为了找到一个最优的阈值, 引入了KL散度(也称相对熵)来衡量不同的INT8分布与原来的FP32分布之间的差异程度, 不了解这个熵理论的可以看这里信息熵理论, 它的公式如下: KL...把校准集输入到模型进行前向推理, 并收集模型中各个Layer的激活值分布直方图, 如左上图所示.然后生成不同的阈值和量化分布, 并计算不同阈值下真实分布P和量化分布的Q的KL散度, 直到找到KL散度最小的一个阈值..., 将Q样本长度拓展到 i ,使得和原样本P具有相同长度;求得Q的概率分布 并计算P、Q的KL散度值step4: 不断循环step2, step3, 就能不断地构造P和Q并计算相对熵,然后找到最小(截断长度为...KL散度的实例1KL分布是用来衡量2个数据分布的距离的, 当两个分布越相近, KL值越小, 分布一样的话, KL=0, 其公式为:H(f|g) = D_{KL}(f, g) = \sum_{x\in X