25小说网 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

2.4 结构因果模型(Scm)

2.4.1 基本定义[5][11]

这是一种基于因果图(casual graph),构建各类因子间因果关系的方法。该方法可以将因果图转为结构化等式(structural equations),并通过do算子干预因果图,打破混淆因子干扰,完成因果发现。

那什么是因果图呢,这是一个有向无环图(dAG),节点表示因子,有向边表示因果关系和大小。如下图(a)是Scm的一个示例。其中t为treatment(即要分析的“因”),y是目标,x是混淆因子。显然,x的存在干扰了分析t对y的影响,作者提出通过do算子去除混淆因子x对treatment的影响,这也是Scm做因果分析的关键。

那具体是怎么实现的呢?我们需要先了解因果图里的经典结构

2.4.2 网络结构与前后门准则[11][12]

三种经典的图结构

当我们分析x和Y的因果关系时,如果存在其他变量Z,则它们的关系不外乎以下三种图结构。

链式(a):x -> Z -> Y。有 且

叉式(b):x <- Z -> Y。同链式有 且

V式(c):x -> Z <- Y。有 且

那么针对这三种图结构,如何输出x变化对Y的影响呢?我们的重点是如何“过滤”变量Z对分析的干扰(这也是因果识别的目标)

2. 后门准则:该准则对应叉式的图结构

后门标准(后门准则):如果变量集Z满足:1 不包含x的子孙节点;2 阻断了x到Y的所有后门路径。则称Z满足(x, Y)的后门准则

后门调整:基于后门路径,通过干预do算子消除混淆因子的影响,仅使用已知的数据分布,估计变量之间的因果效应

3. 前门准则:该准则对应链式结构

前门标准(前门准则):如果变量集Z满足:1 阻断了x到Y的所有路径;2 x到Z之间没有未阻断的路径(x到Z不存在后门路径);3 Z到Y之间的所有后门路径都被x阻断。则称Z满足(x, Y)的前门准则

前门调整:和后门调整类似,通过do算子去除前门路径(链式)的影响

2.4.3 示例说明[13]

这两个准则应该如何使用呢?这里提供一个case

背景:有一种药物,对于男士群体而言,使用该药物后发病率降低。对于女士群体而言,使用该药物后发病率也会降低。但是,对男女人群一起统计,则结论相反

假设t=1表示服药,t=0表示未服药,Y=1表示发病的概率,Y=0表示未发病的概率。显然p ( Y = 1 i t = 1 ) = 0.78 < p ( Y = 1 i t = 0 ) = 0.83,这是因为没有考虑混淆变量“性别”的影响,出现了辛普森悖论。

如下图,通过后门调整,去除掉性别对服药的干扰。则最终 p(Y=1ido(x=1))=0.832 > p(Y=1ido(x=0))=0.781,说明服用此药物确实可以降低发病率。

后面调整的计算逻辑如下:

2.4.4 因果识别

当前Scm模型更多用于因果识别,这是因果推断伴生的研究课题。其目标是从一系列的因子里,找出各因子间的因果相关性并输出因果图,则后续可根据casual graph分析两两因子间的相互影响,揭示因子对结果的多层传递性影响。举个例子[14],我们研究影响产品销量的因素时,可能存在产品价格、产品属性、门店信息、市场竞争情况等因子需要考虑。我们可以构建多个类似下图的因果图模型,然后通过do算法实现干预,判断各因子间存在的因果关系,最终输出概率最大的因果图作为识别的结果[15][16]。本文主要关注因果推断,因果识别不做展开讨论,更多示例可参考相关文章[17]

2.5 潜在结果模型(Rcm)[11]

Rcm关注的是干预前后的期望变化,即2.2所述的treatment effect。该模型不考虑分析所有因子的因果性,只关注treatment和output之间的因果强弱,因此也不需要构建完整了因果图,而是假设treatment和output外的其他因子均为混淆因子,构建粗略的因果图,通过预测反事实的结果,并于观测对比来完成因果推断。

该模型的期望输出分为四种(AtE\/Att\/cAtE\/ItE),可根据业务需求选择。对于for单个研究对象的反事实推断,模型的目标是计算每一个样本i的因果效应,即 = (t=1)? (t=0)。以3.3服药和康复的case为例,t = 是否服药,Y = 是否康复。我们知道,一个人是无法同时观测到吃药和不吃药对康复的影响,Scm也无法推测服药对某个用户的价值。而Rcm则会根据数据形态(即用户属性、历史表现以及混淆因子“年龄”等)预测实际未发生的行为将产生的结果,从而推断出ItE。同理可得出AtE、Att、cAtE。

因为业界很多时候关注的是单个treatment因子的价值,所以Rcm往往是业界的首选。

2.5.1 基本假设

Rcm存在如下3个基本假设[18]:

稳定单元干预值假设(Stable Unit treatment Value Assumption, SUtVA):任意单元的潜在结果都不会因为其他单元的干预发生改变而改变,且对于每个单元,其所接受的每种干预不存在不同的形式或版本,也不会导致不同的潜在结果。以吃药康复的例子解释这里的两层含义,其一是你吃不吃药不影响我是否康复;其二是每种干预是唯一的,吃药不存在吃很多、吃很少的情况,统一药量,要考虑药量就要设置不同的干预值(即此时干预变量不能只是0和1)

25小说网推荐阅读:四合院:我何雨柱,誓不做吸血包四合院:农场主的美好生活四合院:这个住户恐怖如斯九龙至尊四合院:开局奖励神级厨艺重生1983:从夺回家产开始手握购物app:年代女配赢麻了穿成灾星小村姑,把全村都带歪了卷飞全家后我躺平了四合院:从返还技能开始美妇村情一天一个补偿包,反手打爆商业圈猛男诞生记四合院:开局拒绝一大爷换房婚礼现场,我和全家断绝关系!重生皇妃之不争宠武纵八荒我一个中介,会点风水很正常吧荒野求生之我的运气有亿点好山村最强小农民四合院:老子农场在国外重生1960,带着亿万食品仓库四合院:傻兄傻弟下乡知青:直接跟全家断绝关系赤胆特工四合院:我找傻柱报仇,全院慌了最强战神四合院:一人纵横万古神帝穿越古代:悍妇当家每月一首成名曲,打爆娱乐圈四合院:刚得系统,贾家逼我接济无敌升级王年代:随身农场被曝光了80年代剽悍土着女开局当替身,真千金在豪门杀疯了大佬媳妇甜又野救命!大佬她又开始反向许愿了!神魂丹帝人家采蘑菇,你采百年野山参全职中医万界交易,破产小老板的崛起之路邪御天娇携带亿万物资穿越七零四合院:我在四合院看我火爆全网四合院:这一家子惹不起年代1960:穿越南锣鼓巷,四合院:我真不想收拾你们60年代,饥荒年,赶山挖百年参权贵巅峰:我居然是世家子弟
25小说网搜藏榜:斗罗大陆4终极斗罗(斗罗大陆IV终极斗罗)重生皇妃之不争宠武纵八荒我和女神的荒岛生涯重生八零从知青回城开始古玩街直播:你管这叫捡漏?求生综艺爆火后,我成了全民团宠年代:从大山开始仙门弃婿皇上,本宫很会撩校草恋上小丫头狂妻要翻天:沈爷,娶我步步沦陷重生1983,从卖小龙虾开始我一个中介,会点风水很正常吧[穿越]龙小六星际逆袭记女监狱男管教他比火光更耀眼盛少,又又又发狗粮了穿成反派大佬的黑月光是谁劫走了我的初恋弃妃拒承欢本宫娇养的小奶狗被宠野了重生之农女太子妃吾家淘妻不好惹爱妃别跑,本王要以身相许神级提示:开局举报行走的五十万手握超市穿年代,糙汉福妻美又飒直播盗墓游戏,呆妹周姐人麻了!舞动娱乐圈身价万亿,校花被我骗光生活费最强少年医圣绝色风华:腹黑召唤师逆天妖妃撩君心凤鸾九霄环佩锁情仇绝世神医重生七五:王牌娇妻有灵泉重生明星路为动画制作献上美好祝福相婿出山你好,我是人间执剑者纨绔江湖:重生公主惹邪王霸道凌少的小妻子柯南之迪路兽有话要说叶君临李子染大结局2香江1979,我是光影大玩家神医毒妃不好惹云若月红楼之宠妃都市玄门医王
25小说网最新小说:权力巅峰:从1995年重生开始完蛋!在恋综岛被各大龙王包围了神豪:从原神开始我与美女的打野求生神豪:百倍返现,从舔狗到万众瞩目高考落榜我创建修仙大学都重生了谁还拉帮套啊祖坟冒青烟,地府被我搞通货膨胀娱乐:我在兼职,却要补位披哥?双星奇遇记星河浮生被美女虐完后,混蛋道士觉醒了!带女儿摆地摊,全球被我馋哭了!新冷战:异界入侵越放纵越有钱,我享受肆意人生高能世界的悠闲生活想象之界重生:之都市仙君全名修真的时代夫妻对调娃我带好了,你养的家呢我老婆是个什么东西?娱乐圈的素人身有绝症,所有人都后悔了处分我退学,高考又求我回去?重生之最后的茅山道士娱乐,雪藏结束了18岁成神豪,从此深情是路人许昭的人间半途两界穿越:精灵帮我赚钱天物觉醒:我能刻印一切隐姓埋名二十年,崛起先杀白月光离婚烂仔带两娃,你竟突然成神豪SSSS级天赋!我!超凡剑仙!柳条胡同之谁是小嘎么?重生之后,我成了文娱之王病娇美女总裁爱上我浴血江湖大佬:捡个美女做老婆官场:救了神秘大佬,乘风破浪我的维多利亚女友巷口算命那些年恋综:开局成为酒仙重生官场:从复仇开始文娱:不做舔狗,做全网的白月光赛车娘:从零缔造殿堂少女重生:不当舔狗,闪婚霸道女总裁天后上班我睡觉,直到歌词家中曝乱世旅人:莫斯拉之城天降便利店,通古今后赢麻了你让我一个细胞拯救世界