Skip to main content

倾向得分匹配(PSM)

PSM的核心思想是从未受干预的用户群体中,找到和干预对象一模一样的用户,这样就可以把因果效应归因到干预上

介绍

倾向性得分匹配(PSM,Propensity Score Method):主要是基于用户特征来预测用户被活动干预的概率作为倾向得分,选取和实验组用户倾向得分最接近的用户作为对照组;所以倾向性得分是一个用户属于实验组的倾向性

理论上,如果我们对每一个实验组用户都在对照组里匹配一个得分相等的用户,就能得到同质的实验组和对照组,进而来做组间比较。

然而,每个样本有多个特征,对于一个用户来说有:画像特征、行为特征等,如果每个特征都进行匹配,则维度会很多,匹配也会很困难。所以可引进倾向得分P(x)P(x)来代替,这样就可以用一维变量进行匹配,为实验组找到匹配的对照组,消除混杂因子。

原理

假设

步骤

案例

淘宝 - 3D样板间价值分析

用户可以从商详页,首猜,主搜云卡片等渠道进入样板间,并在样板间内实现多点漫游,换风格,搭配家具,放我家等功能,给用户更场景化,私人化的体验。选取进入3D样板间的用户,利用倾向性得分匹配法(PSM)获取对照组的同质用户,分析用户在各个价值指标的差异。

使用20余种用户基本特征,行为特征和家居偏好特征作为混杂因素,应用于匹配模型;

匹配后数据表明,实验组用户的加购率+24.85%,手淘停留时长+27.68%,客单价+29.53%,带货带宽+5.98%,用户决策周期-5.75%

通过PSM的分析结论,我们定量的验证了3D样板间对手淘各项指标的正向价值,进一步的,我们想要挖掘背后是什么因素使得3D样板间产生了这些价值:

参考文献

  1. 因果推断-PSM的原理和应用
  2. 腾讯游戏的 PSM 应用
  3. 因果推断 PSM方法 +Python 代码实战