假设

根据上一节内容我们知道，因果效应是由估计得来的。这也就不难理解，为了让“估计”成立，我们需要一些前提假设对问题进行约束。

Ignorability

Ignorability 假设的定义为

\begin{equation} \text { 给定协变量 } \boldsymbol{x}_i \text {, 则 }\left(y_{0 i}, y_{1 i}\right) \text { 独立于 } D_i \text {, 记为 }\left(y_{0 i}, y_{1 i}\right) \perp D_i \mid \boldsymbol{x}_i \end{equation}

也就意味着，给定 $x_i$ ，则 $\left(y_{0 i}, y_{1 i}\right)$ 在处理组与控制组的分布完全一样，即

\begin{equation} F\left(y_{0 i}, y_{1 i} \mid \boldsymbol{x}_i, D_i=1\right)=F\left(y_{0 i}, y_{1 i} \mid \boldsymbol{x}_i, D_i=0\right) \end{equation}

书上说意思就是对于变量 $X$ 取值一样的人群，是否接受处理和潜在结果相互独立，该怎么理解这个假设呢？

搜了很多讲解，依旧感觉是一个很抽象的假设，举一个我自己的理解例子吧

在考察药物对病人治疗效果的时候， $X$ 为年龄，那么这里是否用药（干预）会影响病人的治疗效果，年龄（干扰因子）本身也会影响病人的治疗效果（越年轻越容易治愈），但是如果我们控制住了年龄，例如限制年龄 $x = 30$ ，此时

如果两个病人有相同的年龄，那么他们使用相同的药物时，他们的潜在结果应该是一样的

具备相同年龄的两个病人，他们的处置分配概率也应该相同。（Unconfoundeness Assumption）

也就是说，通过给定 $x_i$ ，来限制干扰因素对结果的影响，让结果的因就是干预！所以如果所有的干扰因素都可以被观测，都限制住，不就能得到对于因果的推断了吗？所以这也是为什么这个假设也称为【依可测变量选择 - selection on observables】

所以需要假设，当我把 $x_i$ 限制住的时候，潜在结果要和干预是独立的！

Ignorability 这个假设还有很多其它的名字，例如 no unmeasured confounders assumption

条件独立假设 - Conditional Independence Assumption (CIA)
无混淆性 - unconfoundednes
依可测变量选择 - selection on observables

Stable Unit Treatment Value Assumption (SUTVA)

SUTVA 假设用户之间是相互独立的，无互相干扰。SUTVA 保证个体的潜在结果只和他自己有关、最终观察到的结果也只和他自己有关。值得注意的是，社交网络上的实验理论上都很难完完全全保证 SUTVA，但是对于大部分社交属性不强的实验，一般还是假设 SUTVA 基本成立。

其实单位处理变量稳定性假设有两层含义

一层含义是，用户的实验结果是相互独立的，一个用户的行为不能影响另一个用户。这样的例子有很多，比如出租车公司给 A 组用户发放优惠券，结果 A 组用户大量打车。由于市场上出租车的存量是有限的，于是发生了挤兑。结果B组用户既没有优惠券又很难打到车，于是就转而使用其他公司的服务，最终导致 B 组用户的 GMV 暴跌。这就是典型的组间用户的相互影响。

再举一个例子，医生给病人开出某种精神镇定类药物，A 病人先服用，精神好了很多。这个过程病人 B 看见了，于是他在服用的时候，因为有了 A 给他的心理暗示，他也感觉精神好了很多。此时用户间的相互干扰就发生了，因为你说不清病人 B 身上的“药效”，有多少是药物导致的，又有多少是安慰剂效应导致的。

另一层含义是，施加在用户身上的干预不能有版本的区别。比如同样发优惠券，不能给 A 发两毛，给 B 发一块。

Consistency

Consistency 假设潜在结果和观察到的结果是一致的，即当 $T = t$ 时 $Y = Y_t$ 。这个假设一般可以认为是成立的。

Positivity

Positivity（正值假设）假设要求 treatment assignment 有一定随机性，要求对于 $X$ 的所有取值都有 $0 < P_r[T=1|X=x] < 1$

如果这个假设不成立，我们是无法下结论的。例如当一部分用户不可能被投放广告时，我们无法通过历史数据分析广告对他们的效果。当 positivity 假设不成立时，我们往往需要考虑去除一些特殊用户群。

其实就是指用户的处理变量取某个特定值的概率在 0 到 1 之间，它既不能无限趋近于 0，也不能无限趋近于 1。举个例子，假如我们要研究大学教育与未来薪资的关系，但是我们的样本中有这样一个人，他天资聪颖、家境优渥，家长从小就为他铺好了成才之路。这样的样本我们就要把他剔除。因为他太过极端，极端到我们无法想象对应的反事实状态“不上大学”有任何出现的可能。

Positivity 这个假设也有些其它的名字，常见的有 common support 和 overlap。

假设

Ignorability​

Stable Unit Treatment Value Assumption (SUTVA)​

Consistency​

Positivity​

参考文献​

Ignorability

Stable Unit Treatment Value Assumption (SUTVA)

Consistency

Positivity

参考文献