Uplift模型有很多介绍的文章,也有一些评估方式,例如AUUC、 十分位柱状图、累计增益曲线Qini Curve等,但是如果模型结果好或者不好,我们需要怎么进一步分析,却少有文章介绍,本问以Interpretable multiple treatment revenue uplift modeling这篇论文的方法介绍模型分析以及可解释性的方法。
首先Uplift模型从干预和响应类型分为四类,文章主要介绍的场景也是多干预场景连续结果MT-Rev,这也是现实中比较场景的场景,特别是在营销推荐场景中。
文章在MT-Rev场景一种方法是将干预作为特征和未干预做比较获得lift值(Combined Treatment Approach),另一种方法是分别将每一种干预和未干预建模比较lift值(Treatment Comparison Approach),文章使用功第二种方法,基于因果森林算法进行实际分析。整体方法上比较简单,但是文章做了一些深入的可解释性的分析。
使用有两个数据集,也做了一些预处理缺失值填充、去除脏数据等,然后随机抽取70%训练,30%做测试。
数据集的ITE差异:从不同数据集的优惠券类型和ITE分布来看,优惠券数据的个体处理效应(ITE)分布在 [-0.2, 0.2] 之间,而Hillstrom邮件的数据的 ITE 分布在 [-3, 3] 范围内,邮件的干预效果优于优惠券,有可能是因为不同场景本身增益空间天花板就不一样,因为这里模型方法一样。
干预特征和人群的ITE差异:
一般像树模型会输出特征重要度,但是如果是响应模型,特征重要度往往反应的是特征对于结果Y的预测重要度,而非实际对于lift值的重要度,因果树会输出基于lift的特征重要度,文章通过'最小-最大缩放法',在上图中展示了每个干预特征的最重要特征。
对于优惠券数据:
对于邮件数据:
通过预测ITE排名,分别将实验组和对照组以十分位法分桶,然后每个十分位内对比对照组和干预组的收入差异。这里注意由于每个十分内对照组和干预组的的记录数不一样,需要进行等比例缩放进行对比。
上图是前三个十分位上的收入分析,可以看到1/3分位收入均正向。第2个分位收入是负向的,所以即使模型预测ITE正向,对应的玩家收入仍然负向,低于未干预用户。
由于上面某些分位正向有些负向,看不出累计效果,所以又进行了累计收益的分析,
结果可以看到:
价格影响折扣感知:从优惠券场景可以看出,低价产品,顾客可能更倾向于绝对折扣(因为低价的绝对折扣对应的优惠比例更高)进而导致不同类型优惠券在收入上存在差异,这也是为什么15€的优惠券收益最好。。这里也可以引申出消费力不同人群在不同折扣上也会存在收入差异。
写到最后,文章通过因果森林的预测结果,分析两个公开数据集上的ITE效果,这里个人感觉ITE的准确性有待考量,实际线上应该可以通过某些方式来获取CATE来比较不同干预措施的效果,比如psm对齐,或者通过寻找镜像人群。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。