2020.2.3记录今天的收获1
武汉加油
今天天气是阴天,外面感觉白白的,阳光透进来一点,所以白中还掺杂点黄色,这种颜色让人充满希望,就像白色快变苍白,因为黄色而变得有了一些活力。
经过了长达一个月的论文奋战,加上搜资料,终于有一点收获,今天整理一波。
论文:
[1].statistics and causal inference. Paul.W.Holland,1986
[2].The central role of the propensity score in observational studies for causal effects. Paul R.Rosenbaum & Donald B.Rubin,1983
[3].Model-Based Direct Adjustment. Paul R.Rosenbaum,1987
[4].Causally Regularized Learning With Agnostic Data Selection. Zheyan Shen&Peng Cui&Kun Kuang&Bo li&Peixuan Chen. 2018
[5].Treatment Effect Estimation with Data-Driven Variable Decomposition
终于明白了,因果分析,是为了干啥。
首先,定义所有变量:
变量 | 个数 | 实体意义 | 附加 |
---|---|---|---|
unit | N | 每个被操作的个体 | 可能是一个物体的多个性质,也有可能是同一个性质多个物体 |
T | 操作 | 对unit进行操作 | 有T,C两种,其中T就是treatment,C就是control |
Y | 结果 | 被操作后得到的结果 | 常常在论文里,有叫outcome的,有叫response,反正一个意思 |
而因果分析的主要过程就是控制变量法,例如:
从上图可以看到两个unit:,通过treatment:T,得到两个outcome:。我们本想分析T是否对产生作用,然而由于的加入,使得由于T得到的转而对产生的产生了影响,那么我们得到T对产生作用得到的结论是不精确的。
那如何才能精确的得到结果呢?T对于这两个量的影响必须是独立的。也就是说,之间互不影响,才能证明操作有效。
但是,在真实实验中,性质之间互相影响时必然的,无法避免,为了解决该问题。我们可以设置两组:实验组treatment和对照组control。将目标的实验关系对:列出。所以除了外的其他的变量(论文里称之为confounder)只要在两组中相等,或者在某种规则下相等,那这通过这两组得到的结论就是可靠的。
所谓的某种规则,也就是做学术的方向。
为了刻画变化,我们用数学表达式:
加入干预因子,其中就是干预,就是不干预,则,上式为:
显然,可能或者根本就不存在。比如干预了怎么会不发生变化呢,按桌子都会发生形变呢。则改写式子:
这样,如果我们把降到0,那咱们的估计就是完全符合客观事实的了。
上面的降到0也就是我们上面说的,某些规则下相同就行了。而某些规则,我目前发现两个:
1.倾向分
2.矩
具体操作后面再说。今天目前收获这么多。再收,再记。