Logit-Probit中的交乘项及边际效应图示

👇 连享会 · 推文导航 www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：最新专题 | 计量专题 | 关于连享会

🍓 课程推荐：连享会：2025面板数据因果推断专题 · 线上
嘉宾：徐轶青，斯坦福大学
时间：2025 年 6 月 14-15；21-22；28-29 日每天9:00-12:30
咨询：王老师 18903405450（微信）

作者：祁本章 (中山大学)
邮箱：2833210042@qq.com

编者按：本文主要摘译自下文，特此致谢！
[1] Ai C, Norton E C. Interaction terms in logit and probit models[J]. Economics letters, 2003, 80(1): 123-129. -PDF-
[2] Norton E C, Wang H, Ai C. Computing interaction effects and standard errors in logit and probit models[J]. The Stata Journal, 2004, 4(2): 154-167. -PDF-

1. 引言
2. Ai 和 Norton (2003)

2.1 线性模型交互项
2.2 非线性模型交互项
2.3 推导与估计

3. Norton 等 (2004)

3.1 Logit 模型
3.2 Probit 模型

4. Stata 命令
5. 应用实例

5.1 Logit 模型应用
5.2 Probit 模型应用

6. 总结
7. 参考资料
8. 相关推文

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 引言

学者通常会使用交互项来估计某个变量对自变量和因变量间关系的影响。并且，这种交互项估计也更多停留在线性模型下，对于非线性模型，学者在应用上仍存在较大误区。为更好理解交互项、以及其在 Logit 和 Probit 模型中应用，本文将简要介绍 Ai 和 Norton (2003)、Norton 等 (2004) 的论文。在此基础上，具体介绍 Stata 相关命令和案例应用。

2. Ai 和 Norton (2003)

2.1 线性模型交互项

在线性模型中，对交互项系数的解释是直接的。设连续因变量依赖于两个自变量和，它们之间的交互项，一个包含与和无关的常数项的附加自变量向量，以及是未知参数。如果和是连续的，自变量和的交互效应是的期望值的交叉导数。等式如下：

如果和是二分的，那么和从 0 到 1 变化的交互效应可以通过取离散差得到。等式如下：

如果独立于和，那么自变量和的交互作用对于连续和离散交互变量都是。交互效应的统计显著性可用系数的单次检验进行检验。

2.2 非线性模型交互项

非线性模型和线性模型不同，例如，除了因变量是虚拟变量，其他均类似于上例的模型。因变量的条件平均值为：

其中，是标准正态累积分布。假设和是连续的，交互项的交互效应是期望值的交叉导数。结果如下：

然而，大多数应用经济学家计算的是交互项的边际效应，即：

很明显，不等于真正的交互效应。

这些方程对于非线性模型有四个重要的含义：

即使 =0，交互效应也可能是非零的。而对于的 Probit 模型，交互效应为：

交互效应的统计显著性不能用交互项系数的简单检验来检验；
与线性模型中的交互作用不同，在一个非线性模型中，单个不可分割变量的交互效应是以自变量为条件的；
对于不同的协变量值，交互效应可能有不同的符号。因此，的符号并不一定表示交互效应的符号。

2.3 推导与估计

为了更好地改进应用计量经济学者的实践，论文中推导了一般非线性模型中交互效应的大小和标准误差的公式。这些公式很容易应用于 Logit、Probit 和其他非线性模型。

设表示原始因变量，向量为自变量的向量，所以，给定的的期望值为：

其中，函数到已知，并且是两次连续可微的。让表示差分算子或导数算子，这取决于回归系数是离散的还是连续的。

本文的重点是通过计算交叉导数（或差分）来发现交互效应，而不仅仅是通过观察交互项上的系数。和对的交互效应是：

其估计值设为：

为的一致估计量，的连续性和的一致性确保了对的一致性。而对于估计值的标准误，通过 Delta 方法可得公式如下：

而的渐进方差的一致估计为：

是的一致协方差估计。统计量为，且在某些正则条件下，统计量具有渐近标准正态分布。对于给定的，使用统计量检验交互作用效应等于零的假设。这些公式包括许多常用模型，包括 Logit、Probit、Tobit、删失回归模型、带正态误差的对数变换模型、计数模型和持续时间模型。

3. Norton 等 (2004)

3.1 Logit 模型

在 Logit 模型中，是常见的 Logit 累积分布函数：

当交互作用变量都是连续变量时，交互效应是相对于和的交叉导数：

当交互变量均为虚拟变量时，交互效应为离散双差：

当一个连续变量和一个虚拟变量相互作用时，相互作用效应是单个导数 (相对于 ) 的离散差 (相对于 )：

3.2 Probit 模型

对于 Probit 模型，是常见的正态累积分布函数：

当相互作用的变量都是连续的时，相互作用效应是相对于和的二次导数：

当交互变量均为虚拟变量时，交互效应为离散双差：

当一个连续变量和一个虚拟变量相互作用时，交互效应是单个导数 (相对于 ) 的离散差 (相对于 ):

4. Stata 命令

命令安装

search inteff

命令语法

inteff varlist [if exp] [in range] [, savedata(filename[, replace]) savegraph1(filename[, replace]) savegraph2(filename[, replace])]

其中，varlist 必须与 Logit 或 Probit 模型相同，并且至少要包含 4 个变量。并且前 4 个变量的顺序必须是因变量、自变量 1、自变量 2 和自变量 1、2 间的交互项。

savedata(filename[, replace]) 指定保存数据的名称。这里的数据主要包括以下五个变量：

预测概率
交互效应 (用常规线性方法计算)
交互效应 (按本文建议的方法计算)
交互效应的标准差
交互效应的 z 统计量

savegraph(filename[, replace]) 指定保存图的名称。inteff 命令生成两个散点图：

第一个图描绘了两种交互效应 (一个是用本文建议的方法计算的，另一个用传统的线性方法计算) 与预测概率的统计关系；
第二个图形绘制交互效应中的 z 统计量与预测概率的统计关系。

inteff 命令有两个限制：

只适用于 Logit 和 Probit 模型，无法适用于所有非线性模型，比如 Tobit 和 Count 模型；
此外，该命令仅适用于没有高阶项的两个变量间的相互作用。

5. 应用实例

该论文用两个例子来说明 inteff 命令的使用，并且都使用了 2000 年医疗支出小组调查的数据。在该研究中，因变量是在 2000 年是否有过办公室医生就诊。但是，由于本文没有找到案例数据，因此这里仅仅是对原文结果进行描述。

5.1 Logit 模型应用

第一个例子包括年龄和受教育年限之间的交互作用，两者都是连续变量。同时，在该例中，模型还控制了种族、婚姻状况、收入、健康状况和地理区域 (由全局变量 $x 汇总)，但为了简洁起见，没有报告这些变量的结果。

. logit $y age educ ageeduc male ins_pub ins_uni $x, nolog cluster(pid)

Logit estimates                                  Number of obs = 12365                                                    Wald chi2(23) = 9745.78
                                                 Prob >chi(23) = 0.0000
Log pseudo-likelihood = -6889.3644               Pseudo R2     = 0.1189
                        (standard errors adjusted for clustering on pid)

--------+------------------------------------------------------------------
opvisits| Coef.  Robust Std.Err  z  P>|z|  [95%Conf.Interval]
     age| .0419025  .0070434   5.95 0.000  .0280977  .0557073
    educ|  .127117  .0236365   5.38 0.000  .0807903  .1734437
 ageeduc|-.0013739  .0005168  -2.66 0.008 -.0023869 -.0003609
    male|-.9765431  .0348741 -28.00 0.000 -1.044895  -.908191
 ins_pub| .5829237  .1043102   5.59 0.000  .3784794   .787368
 ins_uni|-.8781526  .0541354 -16.22 0.000  -.984256 -.7720491
 (output omitted )
   _cons|-1.559739  .3379041  -4.62 0.000 -2.222019 -.8974595
--------+------------------------------------------------------------------

在运行 Logit 模型之后，我们使用相同的变量列表调用 inteff 命令，并保存数据。

inteff $y age educ ageeduc male ins_pub ins_uni $x, ///
   savedata(d:\data\logit_inteff,replace)           ///
   savegraph1(d:\data\figure1, replace)             ///
   savegraph2(d:\data\figure2, replace)

Logit with two continuous variables interacted
file d:\data\logit_inteff.dta saved
(file d:\data\figure1.gph saved)
(file d:\data\figure2.gph saved)

Variable  |  Obs     Mean    Std.Dev.     Min        Max
----------+------------------------------------------------------------------
_logit_ie | 12365 -.0003334  .0001145  -.0005798   .0001607
_logit_se | 12365  .0001003  .0000311   4.81e-06    .000323
_logit_z  | 12365 -3.401374  1.245229  -6.228868   7.130231

可以看出，年龄和受教育年限不仅在传统水平上具有统计学意义，而且它们之间的交互效应也具有统计学意义 (z 统计量为 −2.66)。这意味着年龄较大、受教育年限较长的人在一年中更有可能进行办公室访问。

但是，在运行 inteff 命令之后，我们了解到平均交互效应为负 (−0.0003334) 且变化很大。对于某些观察值，交互效应是积极的，而对于其他观察值，则是消极的 (参见图 1-a 和图 1-b)。

这证明了交互效应也取决于其他协变量。在这个例子中，对于那些预测有医生就诊的概率在 0.2 左右的人 (图 1-a 的左端)，年龄和受教育年限之间的交互效应对他们一半是正的，一半是负的。如果我们看图 1-a 的右边，对于那些预测有医生就诊的概率在 0.8 左右的人，它们的交互效应都是负的。

就交互作用的显著性而言，对于预测概率约为 0.2 的人群，只有少数人具有统计上显著的交互作用。另一方面，对于预测概率在 0.8 左右的人群，交互效应最为显著。

5.2 Probit 模型应用

第二个例子包括性别和保险状况之间的相互作用。其他设定与 Logit 模型类似。

. probit $y male ins_uni male_uni age educ ins_pub $x, nolog cluster(pid)  




    
Probit estimates                                 Number of obs = 12365                                                    Wald chi2(23) = 9391.46
                                                 Prob >chi(23) = 0.0000
Log pseudo-likelihood = -6897.391                Pseudo R2     = 0.1179
                        (standard errors adjusted for clustering on pid)

--------+------------------------------------------------------------------
opvisits| Coef.  Robust Std.Err z    P>|z|   [95%Conf.Interval]
    male|-.5922717  .0240826 -24.59  0.000  -.6394726 -.5450707
 ins_uni|-.5653776  .0482592 -11.72  0.000  -.6599639 -.4707912
male_uni| .0539772  .0605362   0.89  0.373  -.0646716  .1726261
     age| .0146619  .0012311  11.91  0.000   .0122489  .0170749
    educ| .0407643  .0047575   8.57  0.000   .0314397  .0500888
 ins_pub| .3275272  .0608681   5.38  0.000   .2082279  .4468265
 (output omitted )
   _cons|-.4692864  .0889194  -5.28  0.000  -.6435652 -.2950076
--------+------------------------------------------------------------------

使用相同的变量列表调用 inteff命令，并保存数据。

inteff $y male ins_uni male_uni age educ ins_pub $x, ///
   savedata(d:\data\probit_inteff, replace)          ///
   savegraph1(d:\data\figure3, replace)              ///
   savegraph2(d:\data\figure4, replace)

Probit with two dummy variables interacted
file d:\data\probit_inteff.dta saved
(file d:\data\figure3.gph saved)
(file d:\data\figure4.gph saved)

Variable  |  Obs     Mean    Std.Dev.     Min        Max
----------+------------------------------------------------------------------
_probit_ie| 12365 -.0092839  .0294776  -.0578116  .0829161
_probit_se| 12365  .0218298  .0023465   .0046057  .0314373
_probit_z | 12365 -.5169928  1.522319  -5.561593  5.530833

在这个例子中，与以往不同的是，男性和未参保者之间的交互效应在统计学上并不显著。在线性模型中，我们可以从这样的结果得出交互效应的影响基本上是零的结论。然而，在非线性问题中，我们发现统计显著性范围很广。

尽管交互项上的系数缺乏统计显著性，但充分的交互效应很大，并且对许多观察结果具有统计显著性 (见图 2-a 和图 2-b)。这再次表明，交互效应不等于交互项的边际效应，只看结果表可能会产生误导。

6. 总结

在非线性模型中，交互效应的计算和解释非常复杂，并且不等于其交互项的边际效应。相反，交互效应需要计算交叉导数或交叉差分，且交互作用效应的统计显著性差异很大，需要结合实际问题分析。可以用 inteff 命令计算 Logit-Probit 模型，但在使用时要注意使用条件。

7. 参考资料

Mello M M, Stearns S C, Norton E C. Do Medicare HMOs still reduce health services use after controlling for selection bias?[J]. Health Economics, 2002, 11(4): 323-340. -PDF-
Ai C, Norton E C. Interaction terms in logit and probit models[J]. Economics letters, 2003, 80(1): 123-129. -PDF-
Norton E C, Wang H, Ai C. Computing interaction effects and standard errors in logit and probit models[J]. The Stata Journal, 2004, 4(2): 154-167. -PDF-
Zhou, Xianbo, and Heyang Li. 2021. “Interaction and Quadratic Effects in Probit Model with Endogenous Regressors.” Economics Letters 198: 109695. -PDF-

8. 相关推文

Note：产生如下推文列表的命令为：
lianxh 调节 u型交乘交叉
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：回归分析

Stata：交叉验证简介
Stata因子变量：虚拟变量-交乘项批量处理

专题：内生性-因果推断

Stata：内生变量的交乘项如何处理？

专题：交乘项-调节

内生变量的交乘项如何处理？
interactplot：图示交乘项-交互项-调节效应
Stata：交乘项的对称效应与图示
Stata：图示交互效应-调节效应
Stata：交乘项该如何使用？-黄河泉老师PPT
Stata：虚拟变量交乘项生成和检验的简便方法
追本溯源，U型关系你用对了么？
Stata：调节中介效应检验.md
Stata：内生变量和它的交乘项
utest：检验U型和倒U形关系
交乘项-交叉项的中心化问题
交乘项专题：主效应项可以忽略吗？
离散型调节变量——该如何设定模型？
Stata：交乘项该这么分析!
平方项 = 倒U型？

连享会微信小店上线啦！

Note：扫一扫进入“连享会微信小店”，你想学的课程在这里······

New！ Stata 搜索神器：lianxh 和 songblGIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。