ATE :Average Treatment Effect
ATT :Average Treatment Effects on Treated
CATE:Conditional Average Treatment Effect
ITE:Individual Treatment Effect
ATE:平均处理效应,如AB实验,受处理和未受处理的人群的效果的差的期望
ATT:受处理的人群的平均处理效应,受处理的人群通过PSM方法找出和他们一样的人做为替身,看他们的效果的差别
CATE:人群中某个subgroup的平均处理效应
ITE:个体的因果效应,也可以看成是个体的CATE
如 Burde and Linden (2013) 论文中的例子
的例子,要比较村里有小学和村里没有小学(通勤去距离较远的小学)的孩子,他们的成绩表现是否有差别。
这里ATE是
,代表村里有小学和村里没有小学的成绩表现差异的期望。那有人会说,这些孩子可能本来就有特征差异,比如村里有小学,可能他们家庭条件就比较好。那这里ATT登场了,就来控制他们的这些混淆变量。
这里ATT是
,假设村里有小学的孩子,他们如果村里没有小学,会是什么样的表现呢?同一个人肯定没有办法既受处理又不受处理。那只能在没有小学的群体中用PSM等方法,找出和他们各种特征非常相似的人,如家庭背景、年龄啊,作为他们的替身。这样子就能在理想化的情况下,求同一批小孩,他们在有小学和没有小学的表现是否有差异。
CATE呢?举一个增长领域的例子,我们考虑到投入和产出,要把钱花在刀刃上。人群中有些人是sleeping dogs,就是无论你推广了还是不推广,它都不会转化。我们应该要把钱投入到那些”如果不推广他们就不会转化,但是推广了就会转化的“人群身上,这就是subgroup,我们就要计算给他们投放广告,能带来多少的效果提升(uplift)。
那什么情况下CATE是会等于ATE呢?当没有effect modification(修饰效应)的时候,CATE=ATE。
修饰效应是什么呢?修饰效应指的是有没有一个因素的的不同,使得treatment对outcome的作用也产生了差异。比如是否存在某些因素使得subgroup和整个人群population的效果产生差异呢,是存在的,就是我们刚刚提到的人群特征。并且正是有了effect modification的存在,我们需要按照effect modification进行划分。
再举一个例子,实验看抽烟是否会导致肺癌。这里有一个性别的变量,如果性别的变量仅仅造成男女抽烟的比例不同,那它是一个confounder(混淆变量)。但是,如果性别会影响性激素分泌且性激素分泌会影响肺癌比例,那性别就是一个effect modification,我们需要分性别进行实验。