Skip to main content

假设

根据上一节内容我们知道,因果效应是由估计得来的。这也就不难理解,为了让“估计”成立,我们需要一些前提假设对问题进行约束。

Ignorability

Ignorability 假设的定义为

 给定协变量 xi, 则 (y0i,y1i) 独立于 Di, 记为 (y0i,y1i)Dixi\begin{equation} \text { 给定协变量 } \boldsymbol{x}_i \text {, 则 }\left(y_{0 i}, y_{1 i}\right) \text { 独立于 } D_i \text {, 记为 }\left(y_{0 i}, y_{1 i}\right) \perp D_i \mid \boldsymbol{x}_i \end{equation}

也就意味着,给定 xix_i,则(y0i,y1i)\left(y_{0 i}, y_{1 i}\right) 在处理组与控制组的分布完全一样 ,即

F(y0i,y1ixi,Di=1)=F(y0i,y1ixi,Di=0)\begin{equation} F\left(y_{0 i}, y_{1 i} \mid \boldsymbol{x}_i, D_i=1\right)=F\left(y_{0 i}, y_{1 i} \mid \boldsymbol{x}_i, D_i=0\right) \end{equation}

书上说意思就是对于变量 XX 取值一样的人群,是否接受处理和潜在结果相互独立,该怎么理解这个假设呢?

搜了很多讲解,依旧感觉是一个很抽象的假设,举一个我自己的理解例子吧

在考察药物对病人治疗效果的时候,XX为年龄,那么这里是否用药(干预)会影响病人的治疗效果,年龄(干扰因子)本身也会影响病人的治疗效果(越年轻越容易治愈),但是如果我们控制住了年龄,例如限制年龄 x=30x = 30 ,此时

  1. 如果两个病人有相同的年龄,那么他们使用相同的药物时,他们的潜在结果应该是一样的
  2. 具备相同年龄的两个病人,他们的处置分配概率也应该相同。(Unconfoundeness Assumption)

也就是说,通过给定xix_i,来限制干扰因素对结果的影响,让结果的因就是干预!所以如果所有的干扰因素都可以被观测,都限制住,不就能得到对于因果的推断了吗?所以这也是为什么这个假设也称为【依可测变量选择 - selection on observables】

所以需要假设,当我把xix_i限制住的时候,潜在结果要和干预是独立的!

Ignorability 这个假设还有很多其它的名字,例如 no unmeasured confounders assumption

  • 条件独立假设 - Conditional Independence Assumption (CIA)
  • 无混淆性 - unconfoundednes
  • 依可测变量选择 - selection on observables

Stable Unit Treatment Value Assumption (SUTVA)

SUTVA 假设用户之间是相互独立的,无互相干扰。SUTVA 保证个体的潜在结果只和他自己有关、最终观察到的结果也只和他自己有关。值得注意的是,社交网络上的实验理论上都很难完完全全保证 SUTVA,但是对于大部分社交属性不强的实验,一般还是假设 SUTVA 基本成立。

其实单位处理变量稳定性假设有两层含义

一层含义是,用户的实验结果是相互独立的,一个用户的行为不能影响另一个用户。这样的例子有很多,比如出租车公司给 A 组用户发放优惠券,结果 A 组用户大量打车。由于市场上出租车的存量是有限的,于是发生了挤兑。结果B组用户既没有优惠券又很难打到车,于是就转而使用其他公司的服务,最终导致 B 组用户的 GMV 暴跌。这就是典型的组间用户的相互影响。

再举一个例子,医生给病人开出某种精神镇定类药物,A 病人先服用,精神好了很多。这个过程病人 B 看见了,于是他在服用的时候,因为有了 A 给他的心理暗示,他也感觉精神好了很多。此时用户间的相互干扰就发生了,因为你说不清病人 B 身上的“药效”,有多少是药物导致的,又有多少是安慰剂效应导致的。

另一层含义是,施加在用户身上的干预不能有版本的区别。比如同样发优惠券,不能给 A 发两毛,给 B 发一块。

Consistency

Consistency 假设潜在结果和观察到的结果是一致的,即当 T=tT = tY=YtY = Y_t。这个假设一般可以认为是成立的。

Positivity

Positivity(正值假设)假设要求 treatment assignment 有一定随机性,要求对于 XX 的所有取值都有 0<Pr[T=1X=x]<10 < P_r[T=1|X=x] < 1

如果这个假设不成立,我们是无法下结论的。例如当一部分用户不可能被投放广告时,我们无法通过历史数据分析广告对他们的效果。当 positivity 假设不成立时,我们往往需要考虑去除一些特殊用户群。

其实就是指用户的处理变量取某个特定值的概率在 0 到 1 之间,它既不能无限趋近于 0,也不能无限趋近于 1。举个例子,假如我们要研究大学教育与未来薪资的关系,但是我们的样本中有这样一个人,他天资聪颖、家境优渥,家长从小就为他铺好了成才之路。这样的样本我们就要把他剔除。因为他太过极端,极端到我们无法想象对应的反事实状态“不上大学”有任何出现的可能。

Positivity 这个假设也有些其它的名字,常见的有 common support 和 overlap。

参考文献

  1. 因果推断中的Ignorability假设
  2. 因果推断(二):3个基本假设