主题4:因果表征学习在机器学习中的应用
因果推断
1. Johansson, Fredrik, Uri Shalit, and David Sontag. "Learning representations for counterfactual inference." In International conference on machine learning, pp. 3020-3029. PMLR, 2016.
论文链接:
http://proceedings.mlr.press/v48/johansson16.pdf
推荐语:这是第一篇基于深度表征学习对治疗组和对照组协变量进行筛选和表征,从而预测缺失的潜在结果的文章,并且在线性假设下证明了估计的条件平均因果效应的泛化误差界。
2. Shalit, Uri, Fredrik D. Johansson, and David Sontag. "Estimating individual treatment effect: generalization bounds and algorithms." In International Conference on Machine Learning, pp. 3076-3085. PMLR, 2017
论文链接:https://arxiv.org/pdf/1606.03976.pdf
推荐语:这是上一篇文章的理论扩展,其中给出了一个新的、简单的、直观的泛化误差界,表明一个表征的预期ITE估计误差由该表征的标准泛化误差和该表征所诱导的治疗和对照组分布之间的距离之和所约束。
3. Yao, Liuyi, Sheng Li, Yaliang Li, Mengdi Huai, Jing Gao, and Aidong Zhang. "Representation learning for treatment effect estimation from observational data." Advances in Neural Information Processing Systems 31 (2018).
论文链接:https://par.nsf.gov/servlets/purl/10123149
推荐语:这篇文章提出了一种基于深度表征学习的局部相似性保留个体治疗效应(SITE)的估计方法,主要思想是在平衡控制组和治疗组的分布的基础上,对ITE估计提供有意义约束的局部相似性信息。
4. Hassanpour, Negar, and Russell Greiner. "CounterFactual Regression with Importance Sampling Weights." In IJCAI, pp. 5880-5887. 2019.
论文链接:
https://www.ijcai.org/proceedings/2019/0815.pdf
推荐语:这篇文章将因果表征学习和重加权方法进行了有效结合,提出了一个建立在表征学习模块之上的上下文感知的重要性抽样重加权方案,用于估计ITE。
5. Hassanpour, Negar, and Russell Greiner. "Learning disentangled representations for counterfactual regression." In International Conference on Learning Representations. 2019.
论文链接:https://openreview.net/pdf?id=HkxBJT4YvB
推荐语:考虑到只有一些基于观察到的协变量X的因素有助于选择治疗T,只有一些因素有助于确定结果Y,这篇文章提出了一种新算法来对观察变量进行解藕:(1)从任何给定的观察数据集D中识别上述基本因素的分解表示;(2)利用这种知识来减少选择偏差对估计D中治疗效果的负面影响。
6. Schwab, Patrick, Lorenz Linhardt, and Walter Karlen. "Perfect match: A simple method for learning representations for counterfactual inference with neural networks." arXiv preprint arXiv:1810.00656 (2018).
论文链接:https://arxiv.org/pdf/1810.00656.pdf
推荐语:这篇文章提出了Perfect Match(PM),将之前专注于二值处理变量的方法推广到了多值处理变量,其易于实现,与任何结构兼容,不增加计算复杂性或超参数,并可扩展到任何数量的治疗。
因果生成模型
1. Louizos, Christos, Uri Shalit, Joris M. Mooij, David Sontag, Richard Zemel, and Max Welling. "Causal effect inference with deep latent-variable models." Advances in neural information processing systems 30 (2017).
论文链接:
https://papers.nips.cc/paper/2017/file/94b5bde6de888ddf9cde6748ad2523d1-Paper.pdf
推荐语:这篇文章首次基于变分自编码器(VAE),同时估计混杂因素和因果效应的未知潜空间,从而估计ITE。
2. Yoon, Jinsung, James Jordon, and Mihaela Van Der Schaar. "GANITE: Estimation of individualized treatment effects using generative adversarial nets." In International Conference on Learning Representations. 2018.
论文链接:https://openreview.net/pdf?id=ByKWUeWA-
推荐语:这篇文章提出了一种基于生成对抗网(GANs)框架的新方法来推断ITE,称为用于推断个体化治疗效果的生成对抗网(GANITE),其动机是我们可以通过尝试使用GAN学习反事实分布来捕捉其不确定性。
3. Bica, Ioana, James Jordon, and Mihaela van der Schaar. "Estimating the effects of continuous-valued interventions using generative adversarial networks." Advances in Neural Information Processing Systems 33 (2020): 16434-16445.
论文链接:
https://proceedings.neurips.cc/paper/2020/file/bea5955b308361a1b07bc55042e25e54-Paper.pdf
推荐语:这是上一篇文章的算法扩展,对于连续值干预措施(如与剂量参数相关的治疗),通过对生成对抗网络(GANs)框架的修改,能够同时估计几种不同的连续干预的反事实结果。
4. Zhang, Weijia, Lin Liu, and Jiuyong Li. "Treatment effect estimation with disentangled latent factors." In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 35, no. 12, pp. 10923-10930. 2021.
论文链接:
https://www.aaai.org/AAAI21Papers/AAAI-155.ZhangW.pdf
推荐语:这篇文章提出从观察到的变量中同时推断出相关因素,将这些因素分解成三个不相干的集合,分别对应于工具因素、混杂因素和风险因素,并使用这些分解的因素进行治疗效果估计。
因果公平性
1. Kusner, Matt J., Joshua Loftus, Chris Russell, and Ricardo Silva. "Counterfactual fairness." Advances in neural information processing systems 30 (2017).
论文链接:
https://proceedings.neurips.cc/paper/2017/file/a486cd07e4ac3d270571622f4f316ec5-Paper.pdf
推荐语:这篇文章首次提出“反事实公平性”的概念,利用因果推理的工具开发了一个公平性建模的框架:如果一个决定在(a)实际世界和(b)个人属于不同人口群体的反事实世界中是相同的,那么这个决定对一个人就是公平的。
2. Nabi, Razieh, and Ilya Shpitser. "Fair inference on outcomes." In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 32, no. 1. 2018.
论文链接:https://arxiv.org/pdf/1705.10378.pdf
推荐语:这篇文章认为歧视的存在可以以一种合理的方式被形式化,即敏感的协变量对结果的影响沿着某些因果途径存在,这一观点是对(Pearl 2009)的概括,然后可以通过解决一个受限的优化问题来学习一个公平的结果模型。
3. Chiappa, Silvia. "Path-specific counterfactual fairness." In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 33, no. 01, pp. 7801-7808. 2019.
论文链接:https://arxiv.org/pdf/1802.08139.pdf
推荐语:这篇文章进一步考虑了从数据中学习公平决策系统的问题,其中一个敏感的属性可能会影响到公平和不公平途径的决策,并引入了一种反事实的方法来降低不公平途径上的影响。
4. Wu, Yongkai, Lu Zhang, Xintao Wu, and Hanghang Tong. "Pc-fairness: A unified framework for measuring causality-based fairness." Advances in Neural Information Processing Systems 32 (2019).
论文链接:
https://proceedings.neurips.cc/paper/2019/file/44a2e0804995faf8d2e3b084a1e2db1d-Paper.pdf
推荐语:这篇文章开发了一个测量不同的基于因果关系的公平性的框架,提出了一个统一的定义,涵盖了以前大多数基于因果关系的公平性概念,即特定路径的反事实公平性(PC公平性)。
5. Kilbertus, Niki, Mateo Rojas Carulla, Giambattista Parascandolo, Moritz Hardt, Dominik Janzing, and Bernhard Schölkopf. "Avoiding discrimination through causal reasoning." Advances in neural information processing systems 30 (2017).
论文链接:
https://proceedings.neurips.cc/paper/2017/file/f5f8590cd58a54e94377e6ae2eded4d9-Paper.pdf
推荐语:这篇文章指出观察性标准虽然方便使用,但有严重的内在局限性,使它们无法最终解决公平问题。基于此,本文提出了自然的因果非歧视性标准,并开发了满足这些标准的算法。
因果强化学习
1. Bareinboim, Elias, Andrew Forney, and Judea Pearl. "Bandits with unobserved confounders: A causal approach." Advances in Neural Information Processing Systems 28 (2015).
论文链接:
https://proceedings.neurips.cc/paper/2015/file/795c7a7a5ec6b460ec00c5841019b9e9-Paper.pdf推荐语:这篇文章提出了一个赌博机 Agents 应该追求的优化指标(同时采用实验分布和观察分布),并阐释了其相较于传统算法的优势。
2. Biwei Huang, Fan Feng, Chaochao Lu, Sara Magliacane, Kun Zhang. "AdaRL: What, Where, and How to Adapt in Transfer Reinforcement Learning." International Conference on Learning Representation (2022).
论文链接:https://arxiv.org/abs/2107.02729
推荐语:这篇文章提出了一个理论保证的适应性RL框架,称为AdaRL,利用一种简明的图形表示法来描述RL系统中各变量的结构关系,它可以可靠而有效地适应来自目标领域的少数样本的变化,即使是在部分可观察的环境中。
3. De Haan, Pim, Dinesh Jayaraman, and Sergey Levine. "Causal confusion in imitation learning." Advances in Neural Information Processing Systems 32 (2019).
论文链接:
https://proceedings.neurips.cc/paper/2019/file/947018640bf36a2bb609d3557a285329-Paper.pdf
推荐语:本文指出,由于模仿学习中存在分布偏移(distributional shift),忽略因果会导致破坏性的后果,特别是会出现一种反直觉的“因果错误识别(causal misidentification)”现象:数据越多,效果反而越差。本文研究了这个问题出现的原因,并提出了一种通过定向干预(targeted interventions)——基于环境互动或专家询问——来决定正确因果模型的方法,从而避免这种问题出现。
4. Bottou, Léon, Jonas Peters, Joaquin Quiñonero-Candela, Denis X. Charles, D. Max Chickering, Elon Portugaly, Dipankar Ray, Patrice Simard, and Ed Snelson. "Counterfactual Reasoning and Learning Systems: The Example of Computational Advertising." Journal of Machine Learning Research 14, no. 11 (2013).
论文链接:
https://www.jmlr.org/papers/volume14/bottou13a/bottou13a.pdf
推荐语:本文工作展示了如何利用因果推断来理解复杂学习系统的和环境交互的行为,以及预测系统变化产生的后果。这种预测允许人类和算法来选择可以提升系统性能的改变。
5. Buesing, Lars, Theophane Weber, Yori Zwols, Sebastien Racaniere, Arthur Guez, Jean-Baptiste Lespiau, and Nicolas Heess. "Woulda, coulda, shoulda: Counterfactually-guided policy search." arXiv preprint arXiv:1811.06272 (2018).
论文链接:https://arxiv.org/pdf/1811.06272.pdf
推荐语:本文提出了反事实引导策略搜索(CF-GPS)算法, 从 off-policy 经验中学习部分可观测马尔可夫决策过程(POMDPs)中的策略,利用结构因果 模型对off-policy 的某个回合(episodes)的可能策略进行反事实评估。
6. Pitis, Silviu, Elliot Creager, and Animesh Garg. "Counterfactual data augmentation using locally factored dynamics." Advances in Neural Information Processing Systems 33 (2020): 3976-3990.
论文链接:
https://proceedings.neurips.cc/paper/2020/file/294e09f267683c7ddc6cc5134a7e68a8-Paper.pdf
推荐语:本文通过引入局部因果模型(LCMs),提出了一种基于面向对象状态表示的推断结构的方法,以及一种新的反事实数据增强算法(CoDA)。
7. Dietterich, Thomas, George Trimponias, and Zhitang Chen. "Discovering and removing exogenous state variables and rewards for reinforcement learning." In International Conference on Machine Learning, pp. 1262-1270. PMLR, 2018.
论文链接:
http://proceedings.mlr.press/v80/dietterich18a/dietterich18a.pdf
推荐语:这篇文章将外生状态的变量和奖励形式化,并且确定了具有外生状态的MDP(马尔科夫决策过程)可以被分解为只包含了一个外生状态+奖励的外生马尔可夫奖励过程,和一个仅针对内生奖励定义的内生马尔可夫决策过程的条件。
8. Zhang, Amy, Clare Lyle, Shagun Sodhani, Angelos Filos, Marta Kwiatkowska, Joelle Pineau, Yarin Gal, and Doina Precup. "Invariant causal prediction for block mdps." In International Conference on Machine Learning, pp. 11214-11224. PMLR, 2020.
论文链接:
http://proceedings.mlr.press/v119/zhang20t/zhang20t.pdf
推荐语:这篇文章利用因果推理中的工具,提出了一种不变性预测的方法来学习模型无关状态抽象(MISA),这种抽象在多环境设置下可以推广到新的观测数据中。