Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【多干预多响应】Uplift模型如何做因果推断结果分析?

【多干预多响应】Uplift模型如何做因果推断结果分析?

原创
作者头像
百川AI
发布于 2024-10-20 15:00:44
发布于 2024-10-20 15:00:44
8581
举报

Uplift模型有很多介绍的文章,也有一些评估方式,例如AUUC、 十分位柱状图、累计增益曲线Qini Curve等,但是如果模型结果好或者不好,我们需要怎么进一步分析,却少有文章介绍,本问以Interpretable multiple treatment revenue uplift modeling这篇论文的方法介绍模型分析以及可解释性的方法。

建模方法

首先Uplift模型从干预和响应类型分为四类,文章主要介绍的场景也是多干预场景连续结果MT-Rev,这也是现实中比较场景的场景,特别是在营销推荐场景中。

  • ST-Conv:单干预和二分类响应。
  • ST-Rev:单干预和多分类响应,甚至响应可能是连续值。
  • MT-Conv:多干预和二分类响应。
  • MT-Rev:多干预和多分类响应,甚至响应可能是连续值。

文章在MT-Rev场景一种方法是将干预作为特征和未干预做比较获得lift值(Combined Treatment Approach),另一种方法是分别将每一种干预和未干预建模比较lift值(Treatment Comparison Approach),文章使用功第二种方法,基于因果森林算法进行实际分析。整体方法上比较简单,但是文章做了一些深入的可解释性的分析。

使用有两个数据集,也做了一些预处理缺失值填充、去除脏数据等,然后随机抽取70%训练,30%做测试。

  • 欧洲在线书店的优惠券数据,包含六种优惠券类型和控制组。
  • 美国电子邮件营销促销数据,包含针对男性和女性的促销活动以及控制组

结果分析

ITE效果分析:

数据集的ITE差异:从不同数据集的优惠券类型和ITE分布来看,优惠券数据的个体处理效应(ITE)分布在 [-0.2, 0.2] 之间,而Hillstrom邮件的数据的 ITE 分布在 [-3, 3] 范围内,邮件的干预效果优于优惠券,有可能是因为不同场景本身增益空间天花板就不一样,因为这里模型方法一样。

干预特征和人群的ITE差异

  • 优惠券数据:10€、10% 和 13% 的优惠券主要有负的估计 ITE,而价值为 15€、12% 和 15% 的优惠券主要有正的 ITE。其中15€的优惠券ITE最高
  • 邮件数据:男女人群的干预效果分布没有明显差异,但是女性的峰值ITE高于男性。

特征重要度分析:

一般像树模型会输出特征重要度,但是如果是响应模型,特征重要度往往反应的是特征对于结果Y的预测重要度,而非实际对于lift值的重要度,因果树会输出基于lift的特征重要度,文章通过'最小-最大缩放法',在上图中展示了每个干预特征的最重要特征。

对于优惠券数据:

  • 普遍都重要的特征:当前会话和最近一次会话之间的时间间隔(“到上一会话的时间”)以及当前会话的目标印象频率(“目标浏览量”)在对个干预模型中重要度都很高。
  • 个别重要的特征:顾客在店铺不同页面类型(产品、搜索、概述、主页)上的先前浏览量和最近会话中出现次数等也频繁出现;个别变量在某些干预模型中很重要,在12% 优惠券模型中,是否早上访问重要度很高、最新和最老回话间隔在15券很关键,个人感觉有点怪怪的。

对于邮件数据:

  • 普遍重要特征:去年的消费金额(“历史”)和自上次购买产品以来的月数(“近期”)。即付费额和付费间隔。
  • 个别重要特征:男性像所属郊区、公司电话通信的偏好等影响较大,女性则是是否通过互联网交互。

营销收入结果评估:

通过预测ITE排名,分别将实验组和对照组以十分位法分桶,然后每个十分位内对比对照组和干预组的收入差异。这里注意由于每个十分内对照组和干预组的的记录数不一样,需要进行等比例缩放进行对比。

上图是前三个十分位上的收入分析,可以看到1/3分位收入均正向。第2个分位收入是负向的,所以即使模型预测ITE正向,对应的玩家收入仍然负向,低于未干预用户。

由于上面某些分位正向有些负向,看不出累计效果,所以又进行了累计收益的分析,

结果可以看到:

  • 优惠券数据中,只有15€是正向的收入,看起来该场景式决策是否所有人都发x券,然后分析发了x券与不发券的收益差异,实际场景并不会这样一刀切,可能会针对不同人群下发不同的券值,以期望收益最大化,参考爱彼迎的动态定价的文章。
  • 邮件数据中,基本收入都正向,只有女性第一个分位数负向(尬住),在其他分位数上都优于男性。

价格影响折扣感知:从优惠券场景可以看出,低价产品,顾客可能更倾向于绝对折扣(因为低价的绝对折扣对应的优惠比例更高)进而导致不同类型优惠券在收入上存在差异,这也是为什么15€的优惠券收益最好。。这里也可以引申出消费力不同人群在不同折扣上也会存在收入差异。

写到最后,文章通过因果森林的预测结果,分析两个公开数据集上的ITE效果,这里个人感觉ITE的准确性有待考量,实际线上应该可以通过某些方式来获取CATE来比较不同干预措施的效果,比如psm对齐,或者通过寻找镜像人群。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
1 条评论
热度
最新
可以,大佬,互粉一下
可以,大佬,互粉一下
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
智能营销增益(Uplift Modeling)模型——模型介绍(一)
Uplift Modeling在智能营销中非常重要,一般来说个性化营销人群中存在四类:
悟乙己
2021/12/07
12.6K0
智能营销增益(Uplift Modeling)模型——模型介绍(一)
因果推断笔记——数据科学领域因果推断案例集锦(九)
这部分只是抛砖引玉贴一些看到的非常好的业内方案。 因果推断在很多领域都有很有意思的应用,值得收藏。
悟乙己
2021/12/07
5.1K0
因果推断笔记——数据科学领域因果推断案例集锦(九)
因果推断学习笔记三——Uplift模型「建议收藏」
因果推断在互联网界应用主要是基于Uplift model来预测额外收益提升ROI。Uplift模型帮助商家计算人群营销敏感度,驱动收益模拟预算和投放策略制定,促成营销推广效率的最大化。同时如何衡量和预测营销干预带来的“增量提升”,而不是把营销预算浪费在“本来就会转化”的那部分人身上,成为智能营销算法最重要的挑战。
全栈程序员站长
2022/11/15
12.6K0
因果推断笔记——入门学习因果推断在智能营销、补贴的通用框架(十一)
因果推断笔记——因果图建模之微软开源的dowhy(一) 因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二) 因果推断笔记——python 倾向性匹配PSM实现示例(三) 因果推断笔记——双重差分理论、假设、实践(四) 因果推断笔记——因果图建模之微软开源的EconML(五) 因果推断笔记——工具变量、内生性以及DeepIV(六) 因果推断笔记——自整理因果推断理论解读(七) 因果推断笔记——uplift建模、meta元学习、Class Transformation Method(八) 因果推断笔记——数据科学领域因果推断案例集锦(九) 因果推断笔记——CV、机器人领域因果推断案例集锦(十)
悟乙己
2021/12/07
1.9K0
因果推断笔记——入门学习因果推断在智能营销、补贴的通用框架(十一)
基于uplift模型的营销增益
我们需要识别出TR群体进行营销刺激,对于TN和CR群体可以不发放优惠券以减少成本。而CN群体比较特殊,如果想尽可能的减少成本,可以选择不发放优惠券,若想提高用户的转化则可以选择发放优惠券进行刺激。
HsuHeinrich
2023/08/10
6540
基于uplift模型的营销增益
因果推断笔记——uplift建模、meta元学习、Class Transformation Method(八)
智能营销增益(Uplift Modeling)模型——模型介绍(一) 智能营销增益(Uplift Modeling)模型——pylift库的使用(二)
悟乙己
2021/12/07
6K0
因果推断笔记——uplift建模、meta元学习、Class Transformation Method(八)
因果推断与反事实预测——利用DML进行价格弹性计算(二十四)
经济学课程里谈到价格需求弹性,描述需求数量随商品价格的变动而变化的弹性。价格一般不直接影响需求,而是被用户决策相关的中间变量所中介作用。假设 Q 为某个商品的需求的数量,P 为该商品的价格,则计算需求的价格弹性为,
悟乙己
2022/05/09
4.2K0
因果推断与反事实预测——利用DML进行价格弹性计算(二十四)
智能营销增益(Uplift Modeling)模型——pylift库的使用(二)
上一篇【智能营销增益(Uplift Modeling)模型——模型介绍(一)】仔细介绍了理论部分,本篇主要是算法库pylift的介绍。 在【营销增益模型实战-Uplift Model原理及应用】一文中提到:
悟乙己
2021/12/07
4K0
智能营销增益(Uplift Modeling)模型——pylift库的使用(二)
干货 | 携程火车票基于因果推断的业务实践
携程作为旅游平台,跟用户需求息息相关,理解和识别各个策略/系统对转化/收益的因果关系尤为重要,在这个过程中需要将影响因变量的其他因素进行控制,但这些因素通常是复杂且难以测量的。在关系识别困难的情况下,如何使用更为科学的方法,对策略进行微观和宏观的建模分析,如何系统性的评估各种策略的长期影响,是要解决的重要问题。
携程技术
2023/09/06
9320
干货 | 携程火车票基于因果推断的业务实践
活动、节假日、促销等营销方式的因果效应评估——方法模型篇(二)
笔者近两年都在做智能营销方面的探索,不过最近想稍微切换自己的研究赛道,所以最近想把智能营销方面细枝末节的一些思考发出来。 关于活动、节假日、促销等营销方式的因果效应评估前篇是《活动、节假日、促销等营销方式的因果效应评估——特征工程篇(一)》是把给入模型时特征加工的方式列举一下,本篇是想简单总结如何评价一个活动营销方式的好坏;当然方法本身不胜枚举,只能在有限视野里面进行归纳。
悟乙己
2022/05/11
4.5K0
活动、节假日、促销等营销方式的因果效应评估——方法模型篇(二)
【实践案例分享】阿里文娱智能营销增益模型 ( Uplift Model ) 技术实践
导读:随着移动互联网和人工智能技术的发展,智能化营销正渗透到各行各业。如何衡量和预测营销干预带来的"增量提升",而不把营销预算浪费在"本来就会转化"的那部分人身上,成为智能营销算法最重要的挑战。我们以Uplift Model为基础,构建营销增益预测模型,帮助商家锁定营销敏感人群,驱动收益模拟测算和投放策略制定,促成营销推广效率的最大化。本文将分享营销增益模型的原理和常见的建模及评估方法,并以淘票票智能票补为例介绍Uplift Model技术的实践经验。
木东居士
2020/04/26
11.7K0
【实践案例分享】阿里文娱智能营销增益模型 ( Uplift Model ) 技术实践
因果推断笔记——因果图建模之微软开源的EconML(五)
微软EconML简介:基于机器学习的Heterogeneous Treatment Effects估计
悟乙己
2021/12/07
6.8K1
因果推断笔记——因果图建模之微软开源的EconML(五)
因果推断笔记——因果图建模之Uber开源的CausalML(十二)
其余两篇开源项目的文章: 因果推断笔记——因果图建模之微软开源的EconML(五) 因果推断笔记——因果图建模之微软开源的dowhy(一)
悟乙己
2021/12/07
5.2K0
因果推断笔记——因果图建模之Uber开源的CausalML(十二)
因果推断笔记——自整理因果推断理论解读(七)
之前有整理过一篇:因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二) 不过,那时候刚刚开始学,只能慢慢理解,所以这边通过一轮的学习再次整理一下手里的笔记。
悟乙己
2021/12/07
11.4K0
因果推断笔记——自整理因果推断理论解读(七)
因果推断笔记——python 倾向性匹配PSM实现示例(三)
因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二) 因果推断笔记——因果图建模之微软开源的dowhy(一)
悟乙己
2021/12/07
5.2K0
因果推断笔记——python 倾向性匹配PSM实现示例(三)
干货 | 携程火车票短信召回算法优化实践
互联网蓬勃发展的今天是流量为王的时代,但随着流量红利逐渐消失,获客成本的日益增高,用户留存成为各大互联网公司的重点关注问题,其中流失用户的召回在当今的流量红海市场中显得尤为关键,为此,基于大数据和机器学习的智能营销技术应用而生。
携程技术
2023/09/06
5430
干货 | 携程火车票短信召回算法优化实践
因果推断DiD方法在游戏数据分析中的实践
我们在日常数据相关的工作中,常常需要去推断结果Y是否由原因X造成。“相关性并不意味着因果关系”,相信做数据分析的同学都明白这个道理。有一个喜闻乐见的例子:夏天海岸,鲨鱼袭击事件较其他季节多20%,同时冰淇淋销量比其他季节多100%,冰淇淋销量和鲨鱼袭击事件成正相关关系,得出结论销售冰淇凌会导致鲨鱼袭击。这实际上是违背常识的。
曲奇
2022/01/21
2.3K0
因果推断DiD方法在游戏数据分析中的实践
因果推断笔记——DML :Double Machine Learning案例学习(十六)
核心论文: V. Chernozhukov, D. Chetverikov, M. Demirer, E. Duflo, C. Hansen, and a. W. Newey. Double Machine Learning for Treatment and Causal Parameters. ArXiv e-prints
悟乙己
2021/12/07
8.7K0
因果推断笔记——DML :Double Machine Learning案例学习(十六)
微信基于 StarRocks 的实时因果推断实践
因果推断的核心概念是,从数据中推断一个变量对另一个变量的影响程度。简单来说,它帮助我们了解因果关系的存在和影响力。例如,如果我们上线了一个新的算法模型,能否提升 DAU(日活跃用户)?又或者一个新的产品UI能否增加点击率?这些问题本质上是在问:我们当前所采取的措施是否有效?做得是否正确?因果推断正是用来回答这些问题的,它帮助我们做出科学的决策。
StarRocks
2025/03/13
1210
微信基于 StarRocks 的实时因果推断实践
因果推断杂记——因果推断与线性回归、SHAP值理论的关系(十九)
第一个问题也是从知乎的这个问题开始: 因果推断(causal inference)是回归(regression)问题的一种特例吗?
悟乙己
2021/12/15
3.2K0
因果推断杂记——因果推断与线性回归、SHAP值理论的关系(十九)
推荐阅读
智能营销增益(Uplift Modeling)模型——模型介绍(一)
12.6K0
因果推断笔记——数据科学领域因果推断案例集锦(九)
5.1K0
因果推断学习笔记三——Uplift模型「建议收藏」
12.6K0
因果推断笔记——入门学习因果推断在智能营销、补贴的通用框架(十一)
1.9K0
基于uplift模型的营销增益
6540
因果推断笔记——uplift建模、meta元学习、Class Transformation Method(八)
6K0
因果推断与反事实预测——利用DML进行价格弹性计算(二十四)
4.2K0
智能营销增益(Uplift Modeling)模型——pylift库的使用(二)
4K0
干货 | 携程火车票基于因果推断的业务实践
9320
活动、节假日、促销等营销方式的因果效应评估——方法模型篇(二)
4.5K0
【实践案例分享】阿里文娱智能营销增益模型 ( Uplift Model ) 技术实践
11.7K0
因果推断笔记——因果图建模之微软开源的EconML(五)
6.8K1
因果推断笔记——因果图建模之Uber开源的CausalML(十二)
5.2K0
因果推断笔记——自整理因果推断理论解读(七)
11.4K0
因果推断笔记——python 倾向性匹配PSM实现示例(三)
5.2K0
干货 | 携程火车票短信召回算法优化实践
5430
因果推断DiD方法在游戏数据分析中的实践
2.3K0
因果推断笔记——DML :Double Machine Learning案例学习(十六)
8.7K0
微信基于 StarRocks 的实时因果推断实践
1210
因果推断杂记——因果推断与线性回归、SHAP值理论的关系(十九)
3.2K0
相关推荐
智能营销增益(Uplift Modeling)模型——模型介绍(一)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档