发布网友 发布时间:2024-10-24 08:50
共1个回答
热心网友 时间:2024-10-24 12:47
给定下面的结构化因果模型,可以看到prediction会受到采样的特殊分布的影响从而产生辛普森悖论等相关现象。例如,在small,large stone中接受治疗都会带来正面的影响,但将样本混合起来反而会看到负面的影响。而intervention就不会产生类似的现象。
所谓的Causal Effects可以简单的理解为我们的intervention,即对的因果效应表示为,具体一点可以写为如下形式。其中,表示的父节点,遍历这些父节点可能取值的所有组合。因果效应的可识别性,简单来说就是判断model的解是否唯一。
我们给定因果图和可观测变量分布(假设Stone Size的分布不可知,我们只有的分布),那么问题就是:我们是否可以恢复出的因果效应。也就是说,当前面两个条件给定时,如果所有model计算出的都是一致的,也就是我们能得到一个unique的解。
如果整个 DAG 的结构已知且所有的变量都可观测,那么我们可以根据上面 do 算子的公式算出任意变量之间的因果作用。但是,在绝大多数的实际问题中,我们既不知道整个 DAG 的结构,也不能将所有的变量观测到。因此,仅仅有上面的公式是不够的。
下面,我将介绍 Judea Pearl 提出的 “后门准则”和“前门准则”。这两个准则的意义在于:(1)某些研究中,即使 DAG 中的某些变量不可观测,我们依然可以从观测数据中估计出某些因果作用;(2)这两个准则有助于我们鉴别“混杂变量” 和设计观察性研究。
后门准则():在 DAG 中,如果如下条件满足,称变量的集合相对于变量的有序对满足后门准则。进一步,若相对于变量的有序对满足后门准则,其中和是和中的任意节点;那么称变量的集合相对于节点集合的有序对满足后门准则。
前门准则:在 DAG 中,称节点的集合相对于有序对满足前门准则,如果。此时,如果,则到的因果作用可识别,为。
反事实推理(Counterfactual)对应于极具智慧的人类文明,也是因果之梯的顶峰。counterfactual和干预intervention区分的关键在于“hindsight”(事后来看),即反事实强调在对结果已知观测的基础上再对反事实的问题进行解答:“假如当时发生的与实际情况不同,结果会怎样?”,这就要求一种对虚构世界的推理能力。另一方面,Intervention关注的更多是群体的总效应或者平均因果效应。而反事实更关注特定事件或个体层面的因果关系。
马尔可夫性(Markov property)是构成图模型基础的一个常用假设。当一个分布关于一个图是“马尔可夫”的,则表明这个图能够建模分布中的某些特定的独立性,那么我们就可以利用这些独立性来进行有效的计算或进行数据存储。
忠实性(Faithfulness)与马尔可夫性相对偶。考虑一个分布和一个有向无环图,那么如果和被d分离,那么关于就是忠实的。
因果发现算法及其假设包括基于条件约束的因果发现算法和基于评分的因果发现算法。基于条件约束的因果发现算法需要了解马尔可夫条件和faithfulness假说,这些假设可以在因果图结构和统计独立性之间建立对应关系。基于评分的算法,如GES(Greedy Equivalent Search),旨在通过优化恰当定义的得分函数来发掘因果结构。
函数化因果模型(FCM)提供了一种在等价类中区分不同的有向无环图的方法,这种优势来自除了条件独立关系之外的对数据分布或因果过程的附加假设。FCM将果变量表示为直接原因和一些噪声项的函数,从而在正确的因果方向上噪声和因果之间满足独立条件。
有向无环图(DAG)用于表示变量之间的因果关系。祖先图(Ancestral Graphical Models)和混合祖先图(MAGs)分别用于表示可能涉及潜在混杂因素和选择偏差的数据生成过程,以及在不明确地建模未观察变量的情况下表示数据。混合图(MAGs)中的边表示因果关系或共享的潜在原因。
通过m-分离我们定义了祖先图的马尔可夫性。在DAG中d-seperation的概念刻画了其中隐含的条件独立性,将其拓展到MAG中就称之为m-分离。
因果MAG带有关于真正因果DAG的不确定性,但同时也揭示了基础因果DAG必须满足的特征。因此,MAG中的边意味着单向边代表因果关系,双向边表示两个点之间有共同的因。
在实际问题中,我们可能需要从观测数据中估计因果作用,而不仅仅依赖于公式。后门准则和前门准则提供了工具来帮助我们鉴别不可观测的变量对因果关系的影响,并设计观察性研究以估计因果效应。
最后,反事实推理过程可以分为三个步骤。通过函数化因果模型,我们能够在等价类中区分不同的有向无环图结构,从而更精确地估计因果关系。在因果发现算法中,基于条件约束的方法如PC和FCI,以及基于评分的方法如GES,都在不同场景下提供了估计因果结构的途径。