本文正在参加 人工智能创作者扶持计划
为了解决其他变量/协变量干扰因果效应的问题,老爷子提出了后门准则 & 前门准则。
后门准则
- 假设在变量图中,想要探究 X→YXto Y的因果效应
- 但是图中总有一些指向XX的、看得见(图中有显示)却摸不着(实验中难以测量)的父变量
- 后门准则所解决的就是由于XX的可见不可得的父变量导致无法测量XX对YY的因果效应的问题!
定义:后门准则(The Backdoor Criterion):在有向无环图G=(V,E)G=(V,E)中,给定一对变量(X,Y)∈E(X,Y)in E,则变量集合ZZ相对于(X,Y)(X,Y)满足后门准则,当且仅当ZZ的任一元素均不是XX的后继节点,并且ZZ阻断了所有的在XX和YY之间且指向XX的路径。
如果变量集合ZZ满足后门准则,那么XX对YY的因果效应如下推出:
P(Y=y∣do(X=x))=∑zP(Y=y∣X=x,Z=z)P(Z=z)P(Y=y|do(X=x)) = sum_z P(Y=y|X=x,Z=z)P(Z=z)
- “后门”是指那些连接XX和YY,既指向XX又指向YY的羊肠小道,如X←W→YXleftarrow Wto Y
- “后门”的存在使得XX和YY是相关的,但这种关系不一定是因果的
- 满足后门准则的变量不能是XX的后代,否则XX会因果作用于这类变量,而这类变量又会继续影响YY1。
- 满足后门准则的变量必须是在逻辑图中可见的,而不能是不可观测的协变量(confounders)!
前门准则
- 仍然假设试图探究 X→YXto Y的因果效应
- 后门准则的一大要求是,满足后门准则的变量在逻辑图中是可见的。问题在于,这一条件不一定能时时刻刻都成立。
- 例如:UU为协变量(confounders),并且X←U→YXleftarrow Uto Y。即便这是XX的唯一的“后门”,由于UU不可观测,因此UU不能满足后门准则。
- 前门准则所解决的正是这样的问题!
定义:前门准则(The Front-Door Criterion):给定一个变量集合ZZ,ZZ相对于变量(X,Y)(X,Y)满足前门准则,当且仅当ZZ同时满足以下3个条件:
- ZZ中断(intercept)所有从XX到YY的有向边;
- 不存在关于(X,Z)(X,Z)的后门;
- 所有关于(Z,Y)(Z,Y)的后门均被XX阻断。
如果ZZ满足前门路径,并且P(x,z)>0P(x,z)>0,那么X→YXto Y的因果效应是可识别的,并且可按照如下方式计算:
P(y∣do(x))=∑zP(z∣x)∑x′P(y∣x′,z)P(x′)P(y|do(x)) = sum_{z}P(z|x)sum_{x’}P(y|x’,z)P(x’)
其推导原理如下:
- 由条件2可知,由于不存在(X,Z)(X,Z)的后门,因此:
P(Z=z∣do(X=x))=P(Z=z∣X=x)P(Z=z|do(X=x)) = P(Z=z|X=x)
- 由条件1可知,Z→YZto Y 。因此可以使用后门准则计算 Z→YZto Y的因果效应(书上p68式3.13少写了P(X=x)P(X=x)):
P(Y=y∣do(Z=z))=∑xP(Y=y∣Z=z,X=x)P(X=x)P(Y=y|do(Z=z)) = sum_{x}P(Y=y|Z=z,X=x)P(X=x)
- 接下来考虑到XX对YY的整体因果效应。如果ZZ被自然赋予(do-操作)了值zz,那么YY的取值为yy的概率为P(Y=y∣do(Z=z))P(Y=y|do(Z=z))。对于ZZ的每一个取值zz,在XX被自然赋予(do-操作)了值xx时,其取值概率为P(Z=z∣do(X=x))P(Z=z|do(X=x))。那么X→YXto Y的整体因果效应为
P(Y=y∣do(X=x))=∑zP(Y=y∣do(Z=z))P(Z=z∣do(X=x))=∑z∑x′P(Y=y∣Z=z,X=x′)P(X=x′)P(Z=z∣X=x)=∑zP(z∣x)∑x′P(y∣x′,z)P(x′)P(Y=y|do(X=x)) = sum_{z}P(Y=y|do(Z=z))P(Z=z|do(X=x))\
= sum_{z}sum_{x’}P(Y=y|Z=z,X=x’)P(X=x’)P(Z=z|X=x)\
= sum_{z}P(z|x)sum_{x’}P(y|x’,z)P(x’)
参考文献
- Judea Pearl, Madlyn Glymour, Nicholas P.Jewell.Causal Inference in Statistics: A Primer.2016.WILEY
本文正在参加 人工智能创作者扶持计划