因果推断中的后门和前门准则

释放双眼,带上耳机,听听看~!
本文介绍了因果推断中的后门和前门准则,解决了在探究因果效应时可能出现的变量干扰问题。通过后门准则和前门准则的应用,可以有效计算变量之间的因果关系。

本文正在参加 人工智能创作者扶持计划

为了解决其他变量/协变量干扰因果效应的问题,老爷子提出了后门准则 & 前门准则。

后门准则

  • 假设在变量图中,想要探究 X→YXto Y的因果效应
  • 但是图中总有一些指向XX的、看得见(图中有显示)却摸不着(实验中难以测量)的父变量
  • 后门准则所解决的就是由于XX的可见不可得的父变量导致无法测量XXYY的因果效应的问题!

定义:后门准则(The Backdoor Criterion):在有向无环图G=(V,E)G=(V,E)中,给定一对变量(X,Y)∈E(X,Y)in E,则变量集合ZZ相对于(X,Y)(X,Y)满足后门准则,当且仅当ZZ的任一元素均不是XX的后继节点,并且ZZ阻断了所有的在XXYY之间且指向XX的路径。

如果变量集合ZZ满足后门准则,那么XXYY的因果效应如下推出:

P(Y=y∣do(X=x))=∑zP(Y=y∣X=x,Z=z)P(Z=z)P(Y=y|do(X=x)) = sum_z P(Y=y|X=x,Z=z)P(Z=z)

  • “后门”是指那些连接XXYY,既指向XX又指向YY的羊肠小道,如X←W→YXleftarrow Wto Y
  • “后门”的存在使得XXYY是相关的,但这种关系不一定是因果的
  • 满足后门准则的变量不能是XX的后代,否则XX会因果作用于这类变量,而这类变量又会继续影响YY1。
  • 满足后门准则的变量必须是在逻辑图中可见的,而不能是不可观测的协变量(confounders)!

前门准则

  • 仍然假设试图探究 X→YXto Y的因果效应
  • 后门准则的一大要求是,满足后门准则的变量在逻辑图中是可见的。问题在于,这一条件不一定能时时刻刻都成立。
    • 例如:UU为协变量(confounders),并且X←U→YXleftarrow Uto Y。即便这是XX的唯一的“后门”,由于UU不可观测,因此UU不能满足后门准则。
  • 前门准则所解决的正是这样的问题!

定义:前门准则(The Front-Door Criterion):给定一个变量集合ZZZZ相对于变量(X,Y)(X,Y)满足前门准则,当且仅当ZZ同时满足以下3个条件:

  1. ZZ中断(intercept)所有从XXYY的有向边;
  2. 不存在关于(X,Z)(X,Z)的后门;
  3. 所有关于(Z,Y)(Z,Y)的后门均被XX阻断。

如果ZZ满足前门路径,并且P(x,z)>0P(x,z)>0,那么X→YXto Y的因果效应是可识别的,并且可按照如下方式计算:

P(y∣do(x))=∑zP(z∣x)∑x′P(y∣x′,z)P(x′)P(y|do(x)) = sum_{z}P(z|x)sum_{x’}P(y|x’,z)P(x’)

其推导原理如下:

  • 由条件2可知,由于不存在(X,Z)(X,Z)的后门,因此:

P(Z=z∣do(X=x))=P(Z=z∣X=x)P(Z=z|do(X=x)) = P(Z=z|X=x)

  • 由条件1可知,Z→YZto Y 。因此可以使用后门准则计算 Z→YZto Y的因果效应(书上p68式3.13少写了P(X=x)P(X=x)):

P(Y=y∣do(Z=z))=∑xP(Y=y∣Z=z,X=x)P(X=x)P(Y=y|do(Z=z)) = sum_{x}P(Y=y|Z=z,X=x)P(X=x)

  • 接下来考虑到XXYY的整体因果效应。如果ZZ被自然赋予(do-操作)了值zz,那么YY的取值为yy的概率为P(Y=y∣do(Z=z))P(Y=y|do(Z=z))。对于ZZ的每一个取值zz,在XX被自然赋予(do-操作)了值xx时,其取值概率为P(Z=z∣do(X=x))P(Z=z|do(X=x))。那么X→YXto Y的整体因果效应为

P(Y=y∣do(X=x))=∑zP(Y=y∣do(Z=z))P(Z=z∣do(X=x))=∑z∑x′P(Y=y∣Z=z,X=x′)P(X=x′)P(Z=z∣X=x)=∑zP(z∣x)∑x′P(y∣x′,z)P(x′)P(Y=y|do(X=x)) = sum_{z}P(Y=y|do(Z=z))P(Z=z|do(X=x))\
= sum_{z}sum_{x’}P(Y=y|Z=z,X=x’)P(X=x’)P(Z=z|X=x)\
= sum_{z}P(z|x)sum_{x’}P(y|x’,z)P(x’)

参考文献

  1. Judea Pearl, Madlyn Glymour, Nicholas P.Jewell.Causal Inference in Statistics: A Primer.2016.WILEY

本文正在参加 人工智能创作者扶持计划

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

使用LangChain结合ChatGPT打造私有AI知识库

2023-12-12 15:14:14

AI教程

Spleeter:人工智能AI库助你轻松分离背景音乐和人声

2023-12-12 15:24:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索