假设
根据上一节内容我们知道,因果效应是由估计得来的。这也就不难理解,为了让“估计”成立,我们需要一些前提假设对问题进行约束。
Ignorability
Ignorability 假设的定义为
也就意味着,给定 ,则 在处理组与控制组的分布完全一样 ,即
书上说意思就是对于变量 取值一样的人群,是否接受处理和潜在结果相互独立,该怎么理解这个假设呢?
搜了很多讲解,依旧感觉是一个很抽象的假设,举一个我自己的理解例子吧
在考察药物对病人治疗效果的时候,为年龄,那么这里是否用药(干预)会影响病人的治疗效果,年龄(干扰因子)本身也会影响病人的治疗效果(越年轻越容易治愈),但是如果我们控制住了年龄,例如限制年龄 ,此时
- 如果两个病人有相同的年龄,那么他们使用相同的药物时,他们的潜在结果应该是一样的
- 具备相同年龄的两个病人,他们的处置分配概率也应该相同。(Unconfoundeness Assumption)
也就是说,通过给定,来限制干扰因素对结果的影响,让结果的因就是干预!所以如果所有的干扰因素都可以被观测,都限制住,不就能得到对于因果的推断了吗?所以这也是为什么这个假设 也称为【依可测变量选择 - selection on observables】
所以需要假设,当我把限制住的时候,潜在结果要和干预是独立的!
Ignorability 这个假设还有很多其它的名字,例如 no unmeasured confounders assumption
- 条件独立假设 - Conditional Independence Assumption (CIA)
- 无混淆性 - unconfoundednes
- 依可测变量选择 - selection on observables
Stable Unit Treatment Value Assumption (SUTVA)
SUTVA 假设用户之间是相互独立的,无互相干扰。SUTVA 保证个体的潜在结果只和他自己有关、最终观察到的结果也只和他自己有关。值得注意的是,社交网络上的实验理论上都很难完完全全保证 SUTVA ,但是对于大部分社交属性不强的实验,一般还是假设 SUTVA 基本成立。
其实单位处理变量稳定性假设有两层含义
一层含义是,用户的实验结果是相互独立的,一个用户的行为不能影响另一个用户。这样的例子有很多,比如出租车公司给 A 组用户发放优惠券,结果 A 组用户大量打车。由于市场上出租车的存量是有限的,于是发生了挤兑。结果B组用户既没有优惠券又很难打到车,于是就转而使用其他公司的服务,最终导致 B 组用户的 GMV 暴跌。这就是典型的组间用户的相互影响。
再举一个例子,医生给病人开出某种精神镇定类药物,A 病人先服用,精神好了很多。这个过程病人 B 看见了,于是他在服用的时候,因为有了 A 给他的心理暗示,他也感觉精神好了很多。此时用户间的相互干扰就发生了,因为你说不清病人 B 身上的“药效”,有多少是药物导致的,又有多少是安慰剂效应导致的。
另一层含义是,施加在用户身上的干预不能有版本的区别。比如同样发优惠券,不能给 A 发两毛,给 B 发一块。
Consistency
Consistency 假设潜在结果和观察到的结果是一致的,即当 时 。这个假设一般可以认为是成立的。
Positivity
Positivity(正值假设)假设要求 treatment assignment 有一定随机性,要求对于 的所有取值都有
如果这个假设不成立,我们是无法下结论的。例如当一部分用户不可能被投放广告时,我们无法通过历史数据分析广告对他们的效果。当 positivity 假设不成立时,我们往往需要考虑去除一些特殊用户群。
其实就是指用户的处理变量取某个特定值的概率在 0 到 1 之间,它既不能无限趋近于 0,也不能无限趋近于 1。举个例子,假如我们要研究大学教育与未来薪资的关系,但是我们的样本中有这样一个人,他天资聪颖、家境优渥,家长从小就为他铺好了成才之路。这样的样本我们就要把他剔除。因为他太过极端,极端到我们无法想象对应的反事实状态“不上大学”有任何出现的可能。
Positivity 这个假设也有些其它的名字,常见的有 common support 和 overlap。