如何优雅地处理含交互项的logit模型？

编者按

本期推送的是Maarten L. Buis于2010年在The Stata Journal上发表的Stata tip 87: Interpretation of interactions in nonlinear models一文。在非线性模型中，除了解释其边际效应之外还有什么方法呢？让我们一起看看吧。

这是社论前沿第S1582次推送

微信号：shelunqianyan

在拟合一个非线性模型（如logit或poisson），在解释回归系数时，通常有两种选择：计算某种形式的边际效应或指数化系数，也即计算几率比（odds ratio，OR）或发生率之比（incidence-rate ratio,IRR）。边际效应是解释变量单位变化时，因变量预计增加或减少多少；也就是说,边际效应是“加法”的。指数化系数给出了因变量随解释变量单位变化而变化的比率，也就是说，指数化系数是“乘法”的。

有时，学者还想研究一个变量对因变量的影响，如何在另一个变量作用下发生变化，这就是交互效应。本文讨论当交互效应通过几率比（OR）或发生率比（incidence-rate ratio, IRR）时，如何解释交互效应。

以往人们用边际效应来解释交互作用时，有一个常见的错误：将两个解释变量之间的乘法项的一阶导数解释为交互效应。然而，其实人们更希望两个变量（x1和x2）之间的交互效应表示单位x2改变，x1改变了多少。边际效应计算中，x1的效应是因变量的期望值（E[y]）相对于x1的一阶导数，也即E[y]因x1中的单位变化而变化多少的近似值。

因此，交互效应，应该是E[y]相对于x1和x2的交互偏导数，即x2每变化一个单位，E[y]对x1的导数变化的估计值。在非线性模型中，这不同于E[y]关于乘法项x1×x2的一阶导数。这就是Norton，Wang和Ai（2004）的inteff和Cornelißen和Sonderhof（2009）提到的诸如inteff3的程序的设计原理。

可以无需引用任何额外的程序，将交互效应效果呈现为乘法效应，例如，几率比OR、发生比IRR、风险比hazard ratios。同时使用加法效应和乘法效应，可能效果会更好。

可以用例子说明。本文研究了拥有大学学位（collgrad）对黑人和白人女性获得“高”工作的几率（high_occ）影响是否不同。

（温馨提示：点击查看大图）

如果用边际效应来解释这些结果，通常会考虑解释变量对获得高工作的概率的影响。然而，这个例子使用了一个logit模型和or选项，所以因变量是用几率(odds)度量的，而不是用概率(probability)度量的。人们通常认为几率（odds）很难理解，但它们只是每个低职位的人所对应的高职位人数的期望。例如，没有大学学位的白人女性获得高职位的基线几率率是0.32，这意味着在这一类别中，每个低职位的女性都有对应的0.32名高职位女性；拥有大学学历的女性获得高职位的几率是女性的2.47倍。collgrad和black之间也存在交互，大学学历对黑人女性的影响是白人女性的1.48倍。

在黑人和白人女性之间有多大的不同，但它是以乘法的方式来表示的。结果还表明，这种相互作用并不显著。

这个例子指出了边际效应和乘法效应的区别。现在可以将边际效应计算为拥有和没有大学学位的女性的几率之差，而不是作为几率相对于collgrad的导数。虽然这是对术语的滥用，但下文将继续称之为边际效应。

下面的margins命令显示了black和collgrad的每个组合获得一个高工作的几率。没有大学学历的白人女性获得高职位的几率是0.32，而拥有大学学历的白人女性的几率是0.79。因此，collgrad对白人女性的边际效应为0.47。collgrad对黑人女性的边际效应只有0.36。因此，collgrad对白人女性的边际效应大于黑人女性，而collgrad对黑人女性的乘数效应大于白人女性。

（温馨提示：点击查看大图）

产生这种差异的原因是乘法效应是相对于它们自己类别中的基线几率的。在这个例子中，黑人和白人女性的基线几率有很大不同：对于没有大学学位的白人女性，每个低职位的女性对应0.32个高职位的女性；对于没有大学学位的黑人女性，每个低职位的女性对应0.14个高职位的女性。因此，尽管白人女性获得大学学位的几率比黑人女性高，白人女性基线的增加比值比黑人女性低。乘法效应以此控制两组在基线上的差异。

这里的例子相对简单，只有二进制变量，没有控制变量。但是，当使用连续变量和添加控制变量时，基本参数仍然有效。此外，该参数不限于从logit获得的结果。它适用于所有形式的乘法效应，如，ologit，glogit, mlogit,poisson，nbreg等。

文献来源：

Maarten L. Buis（2010）Stata tip 87: Interpretation of interactions in nonlinear models，The Stata Journal，10, Number 2, pp. 305–308

END

文献整理｜江南林一

美编｜江南林一

责编｜布梦茹

图｜网络

【社论前沿招募】点击这里，加入我们！

如何优雅地处理含交互项的logit模型？ | 社论前沿