2020.2.3记录今天的收获1

武汉加油

今天天气是阴天,外面感觉白白的,阳光透进来一点,所以白中还掺杂点黄色,这种颜色让人充满希望,就像白色快变苍白,因为黄色而变得有了一些活力。

经过了长达一个月的论文奋战,加上搜资料,终于有一点收获,今天整理一波。
论文:
[1].statistics and causal inference. Paul.W.Holland,1986
[2].The central role of the propensity score in observational studies for causal effects. Paul R.Rosenbaum & Donald B.Rubin,1983
[3].Model-Based Direct Adjustment. Paul R.Rosenbaum,1987
[4].Causally Regularized Learning With Agnostic Data Selection. Zheyan Shen&Peng Cui&Kun Kuang&Bo li&Peixuan Chen. 2018
[5].Treatment Effect Estimation with Data-Driven Variable Decomposition
终于明白了,因果分析,是为了干啥。
首先,定义所有变量:

变量 个数 实体意义 附加
unit N 每个被操作的个体 可能是一个物体的多个性质,也有可能是同一个性质多个物体
T 操作 对unit进行操作 有T,C两种,其中T就是treatment,C就是control
Y 结果 被操作后得到的结果 常常在论文里,有叫outcome的,有叫response,反正一个意思

而因果分析的主要过程就是控制变量法,例如:
2020.2.3记录今天的收获1
从上图可以看到两个unit:x1,x2x_1,x_2,通过treatment:T,得到两个outcome:y1,y2y_1,y_2。我们本想分析T是否对x2x_2产生作用,然而由于x1x_1的加入,使得由于T得到的y1y_1转而对x2x_2产生的y2y_2产生了影响,那么我们得到T对x2x_2产生作用得到y2y_2的结论是不精确的。
那如何才能精确的得到结果呢?T对于x1,x2x_1,x_2这两个量的影响必须是独立的。也就是说,y1,y2y_1,y_2之间互不影响,才能证明操作有效。
但是,在真实实验中,性质之间互相影响时必然的,无法避免,为了解决该问题。我们可以设置两组:实验组treatment和对照组control。将目标的实验关系对:(xi,y)(x_i,y)列出。所以除了xix_i外的其他的变量xjx_j(论文里称之为confounder)只要在两组中相等,或者在某种规则下相等,那这通过这两组得到的结论就是可靠的。
所谓的某种规则,也就是做学术的方向。
为了刻画变化,我们用数学表达式:
ATT=E(Yi(1))E(Yi(0))ATT=E(Y_i(1))-E(Y_i(0))
加入干预因子DiD_i,其中Di=1D_i=1就是干预,Di=0D_i=0就是不干预,则,上式为:
ATT=E(Yi(1)Di=1)E(Yi(0)Di=1)ATT=E(Y_i(1)|D_i=1)-E(Y_i(0)|D_i=1)
显然,E(Yi(0)Di=1)E(Y_i(0)|D_i=1)可能或者根本就不存在。比如干预了怎么会不发生变化呢,按桌子都会发生形变呢。则改写式子:
ATT=[E(Yi(1)Di=1)E(Yi(0)Di=0)]+[E(Yi(0)Di=0)E(Yi(0)Di=1)]ATT=[E(Y_i(1)|D_i=1)-E(Y_i(0)|D_i=0)]+[E(Y_i(0)|D_i=0)-E(Y_i(0)|D_i=1)]
ATTstand=[E(Yi(1)Di=1)E(Yi(0)Di=0)]ATT_{stand}=[E(Y_i(1)|D_i=1)-E(Y_i(0)|D_i=0)]
selectionbias=[E(Yi(0)Di=0)E(Yi(0)Di=1)]selectionbias=[E(Y_i(0)|D_i=0)-E(Y_i(0)|D_i=1)]
这样,如果我们把selectionbiasselectionbias降到0,那咱们的估计就是完全符合客观事实的了。
上面的降到0也就是我们上面说的,某些规则下相同就行了。而某些规则,我目前发现两个:
1.倾向分
2.矩
具体操作后面再说。今天目前收获这么多。再收,再记。