论文复现：引入注意力的考虑集模型-alogit

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果： DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：最新专题 | 计量专题 | 关于连享会

🍓 课程推荐：连享会：2025暑期班·网络直播
嘉宾：连玉君 (初级+高级) || 张宏亮 (论文班)
时间：2025 年 8 月 4-14 日
咨询：王老师 18903405450（微信）

作者：吴奕玮 (中山大学)
邮箱：wuyw56@mail2.sysu.edu.cn

编者按：本文主要摘译自下文，特此致谢！
Source：Abaluck, J., A. Adams-Prassl, 2021, What do consumers consider before they choose? Identification from asymmetric demand responses, The Quarterly Journal of Economics, 136 (3): 1611-1663. -PDF--Data-

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. alogit模型简介

1.1 理论背景
1.2 Stata 实操

2. alogit模型构建

2.1 问题背景
2.2 实证模型
2.3 结果探讨

3. 总结
4. 相关推文

1. alogit模型简介

1.1 理论背景

alogit 是由 Abalack 和 Adams 于 2017 年首次提出的，专门用于计算 Abalack 和 Adams (2017) 中的消费者选择模型中的 (非) 专注 logit 模型。

传统的离散选择模型通常假设消费者在做出选择时会考虑所有可用的选项。然而，考虑集放宽了这一假设，认为人们更倾向于只考虑其中的一部分商品 (考虑集)，这是对离散选择模型的一种概括。产生考虑集的可能原因之一是注意力的分散或有界理性。为了研究这种“注意力”对选择结果的影响，Abalack 和 Adams 提出了 alogit 模型。

alogit 的核心思想在于，在分析这个二元选择模型时引入了注意力这一因素。对于不专注于特定商品的消费者来说，在选择商品时，他们不仅仅依据商品的特性，还关注选择该商品的概率。

另外，alogit 还可以估计另一类考虑集模型——DSC 模型。在这个模型中，注意力的概率仅取决于默认商品。消费者要么关注所有商品并做出选择，要么保持注意力不集中并选择默认商品。

1.2 Stata 实操

在 alogit 模型中，考虑集是有概率的，每个备选方案都有不被考虑的可能性。因此，存在概率非零的完全为空的考虑集。为了更好地确定模型，当考虑集为空时，默认选项通过 default() 指定。如果缺少默认项，则通过 consider() 指定哪些商品被考虑的概率为 1，以确保永远不会出现空集的情况。

alogit 将空集的概率存储在 e(mp0) 中，如果这个概率是不可忽略的，将输出警告 (当传递 consider() 时，为了计算该概率，将忽略它)。

1.2.1 命令安装

net describe alogit, from(http://fmwww.bc.edu/RePEc/bocode/a)
net install alogit.pkg, replace

1.2.2 命令语法

alogit depvar [indepvars] [if] [in] , {default(varname) | consider(varname)} 
  group(varname) [options]

其中，depvar 表示消费者的选择，indepvars 是影响选择和注意力的协变量，zvars 是只影响注意力的变量。options 主要包含以下内容：

group(varname)：个体标识；
default(varname)：表示每个个体的默认选择商品的二元变量；
consider(varname)：表示关注概率为 1 的商品的二元变量；
avars(varlist)：在注意力概率估计中使用 varlist 代替 indepvars；
zvars(varlist)：在注意力概率估计中包含 varlist；
exclude(varlist)：从注意力概率估计中排除 varlist；
noconstant：估计 P(A) 时不要自动添加常数；
model(str)：模型选择 alogit 或 dsc；
b0(numlist)：计算 P(Y) 时独立变量的起始参数；
g0(numlist)：计算 P(A) 时，indepvars 或 avars 的启动参数；
d0(numlist) ：计算 P(A) 时 zvars 和常数的起始参数；
exp：估计 exp(b) 而不是 b；
method(str) ：方法选择 exact 或 importance；
reps(int) ：method(importance) 方法下随机抽样的选择集数量；
noprob(str)：如何处理 P(A) = 0 的情况， error 或 drop。

1.2.3 命令示例

在不同时间点，不同消费者对同一组商品做出选择，目的是分析注意力因素对消费者选择的影响。其中，chosen 表示是否选择的二元变量，price_dm 是价格水平 (商品价格与均值的偏离)，proddum* 表示不同商品的虚拟变量。根据不同消费者的不同选择时期 (benetime) 进行分组回归，默认选项是第 9 号商品 (proddum9)。回归得到的 P(A) 表示不同商品被关注的概率。数据和代码详见 Data。

. alogit chosen price_dm proddum*,                  ///
>   group(benetime) method(exact) default(proddum9) ///
>   technique(nr) difficult b0(`betavec')

Attentive logit regression                    Log likelihood  = -1.539e+04
                                                    Number of obs = 74,500
--------------------------------------------------------------------------
      chosen | Coefficient  Std. err.      z    P>|z| [95% conf. interval]
-------------+------------------------------------------------------------
PY           |
    price_dm |     -0.196      0.028    -7.11   0.000   -0.250      -0.142
    proddum1 |      1.465      0.539     2.72   0.007    0.409       2.522
    proddum2 |     -0.065      0.478    -0.14   0.892   -1.002       0.871
    proddum3 |      0.625      0.476     1.31   0.189   -0.307       1.557
    proddum4 |      0.629      0.466     1.35   0.177   -0.284       1.543
    proddum5 |      0.707      0.478     1.48   0.139   -0.231       1.645
    proddum6 |     -0.737      0.121    -6.09   0.000   -0.974      -0.500
    proddum7 |     -1.280      0.141    -9.07   0.000   -1.556      -1.003
    proddum8 |     -1.185      0.137    -8.63   0.000   -1.454      -0.916
    proddum9 |     -0.561      0.118    -4.76   0.000   -0.793      -0.330
-------------+------------------------------------------------------------
PA           |
    price_dm |      0.137      0.017     8.05   0.000    0.103       0.170
    proddum1 |     -2.872      0.177   -16.26   0.000   -3.218      -2.526
    proddum2 |     -2.674      0.288    -9.27   0.000   -3.239      -2.108
    proddum3 |     -2.695      0.209   -12.91   0.000   -3.104      -2.286
    proddum4 |     -2.704      0.205   -13.21   0.000   -3.105      -2.303
    proddum5 |     -2.592      0.204   -12.68   0.000   -2.993      -2.191
    proddum6 |      0.152      0.192     0.79   0.428   -0.224       0.527
    proddum7 |      0.123      0.292     0.42   0.674   -0.449       0.695
    proddum8 |      0.258      0.230     1.12   0.262   -0.193       0.709
    proddum9 |      0.103      0.176     0.59   0.558   -0.242       0.448
       _cons |      0.624      0.217     2.88   0.004    0.199       1.049
---------------------------------------------------------------------------

2. alogit模型构建

2.1 问题背景

文章利用引入注意力的考虑集模型，识别价格或其他商品特征变化对消费者选择的影响。过往研究认为特征变化通过考虑或效用影响消费者选择，并由此分为两类模型。第一类是默认考虑模型 (DSC)，其中消费者在考虑的过程中可能选择默认选项，或者在所有产品中做出积极的选择。第二类是替代考虑模型 (ASC)，它认为效用影响选择，即消费者对每种商品都有一个独立的考虑概率，该概率取决于相关商品特征。

这两种类型的经验模型通常依赖于关于所考虑的商品的辅助数据，或者依赖于结构函数点识别的附加排除限制。这些排除限制通常是有问题的，并且可能与经济理论相矛盾。哪些变量影响效用哪些变量影响注意力，都与对象的部分识别有关。

2.2 实证模型

2.2.1 基本框架

考虑个体在种产品中进行离散选择，，其中。每个产品与价格相关。价格向量在上成立。

让代表商品的考虑集，任何给定元素都以为索引，那么包含商品的考虑集就给出为：

选择概率采取以下形式：

其中，是市场价格为时商品被购买的观察概率，是给定观察特征下商品集被考虑的概率，是商品从商品集中被选中的概率。

基础理论假设

Daly-Zachary 条件：未观察到的潜在选择概率，在上处处满足以下条件：

性质：恒存在，大于等于 0 且连续。
对称性：交叉价格衍生品是对称的。

无名义幻觉：。

基础数据假设

在上观察到的人口市场份额、自有和交叉价格衍生品包含如下变量：

2.2.2 默认特定模型 (DSC)

DSC 模型中，默认商品和非默认商品的市场份额形式如下：

其中，微分函数给出了考虑所有可能产品的概率，给出了在考虑所有产品的条件下选择商品的概率。

DSC 假设：当。

识别考虑概率的变化：如果默认选项的价格是通过引起消费者的“觉醒”影响考虑，则非默认选项会对价格更加敏感。

识别考虑的水平：

LOGIT考虑下的识别：

2.2.3 替代特定模型 (ASC)

ASC 模型中，考虑集概率的形式如下：

其中，商品被考虑的概率是一个只关于商品自身特征的微分函数，而且对于所有有。观察到市场份额的形式为：

ASC 假设：

当
在上，。

识别考虑概率的变化：

的识别：

2.2.4 混合考虑集模型

混合考虑集模型中，默认商品和非默认商品的市场份额形式如下：

识别考虑概率的变化：

2.2.5 过度认同

鉴于文章的假设，不完美的考虑是引起不对称交叉衍生品的唯一机制。然而，放宽背景假设可能会引起不对称性的其他来源，错误地归因于注意力不集中。因此，文章的模型是过度识别的，并且框架预测的不对称具有特定的结构。当时，对数考虑概率的导数被过度识别。从直觉上看，交叉价格衍生工具的差异大于考虑概率。

2.3 结果探讨

在实验设计方面，文章先在实验室用自己产生的消费实验数据验证了识别结果的实际意义，而后使用该模型预测了医疗保险 D 部分“智能默认”政策的效果，并对结果进行规范性评估。

2.3.1 实验室验证

作者对 149 名耶鲁大学的学生进行了离散选择的消费实验。选择了耶鲁大学书店出售的 10 种商品，清单价格从 19.98 美元到 24.98 美元不等。每个参与者都有 25 美元，从这 10 种商品中随机选择的子集中做出 50 个选择，价格也是随机的清单价格的三分之一加上 0 到 16 美元之间的均与分布的金额。

消费者在显示的子集中所有产品的图像以及价格中，被要求选择他们的首选方案。把出现在受访者屏幕上的产品子集视为考虑集。每种商品出现在屏幕上的概率是由作者事先固定的——这种概率在不同的商品和价格之间变化，如果商品的价格较高，则更有可能被考虑。

商品在受访者的第轮选择中被考虑的概率：

其中是商品的价格，是该商品的固定效应。

作者使用关于受访者看到的所有数据，包括提前设置好的考虑系数，以此给出“真实”的考虑和偏好系数。同时，在偏好参数的情况下，采用现有考虑集模型应用的传统最大似然估计法，以及指定的条件 Logit 模型来进行间接推理，将得到的估计值与文章设定的模型估计结果进行比较。

间接推理中选择概率的简化辅助模型：

此表报告了条件 Logit 和 ASC 模型的系数估计值。估计值分别是效用和注意力方程中的系数。估计得到的条件 Logit 系数是基于所有十种商品都会被考虑的假设。“考虑条件”的效用参数是基于消费者面临的实际选择集，使用条件 Logit 模型估计得到的。而注意力参数是由作者预先设定的“真实值”。ASC 模型还包括一个考虑概率常数。

结果显示，条件 Logit 模型中，一个由所有 10 种商品组成的考虑集的价格效应不到真实值的三分之一。条件 Logit 模型错误地从高价产品更有可能被考虑的事实中推断出消费者不是真正不喜欢高价。此外，条件 Logit 的固定效应是有系统性偏差的，它混淆了考虑和效用——那些很少出现在考虑集中的产品被认定为低效用。

相比之下，文章设定的考虑集模型能够准确地还原产生选择的过程。最大似然法和间接推理策略估计出的考虑价格影响的置信区间均包含真实值。考虑集模型也还原了注意力的固定效应，准确区分了注意力这一因素。

2.3.2 医疗保险 D 部分的有限理性和智能默认

医疗保险 D 部分计划向美国的老年提供处方药保险。该计划创建于 2006 年，以应对药品支出的增加，为当时没有处方药保险的老年医疗保险受益人带来大量的自付费用。主要分析样本包括 100,000 名随机选择的非双重受益人，他们在 2008-2009 年加入了该计划。

作者将样本限制在观察到的前一年计划的受益人 (放弃了 17.5% 的受益人)。为了降低估计替代性特定注意参数的计算负担，作者也重新严格了样本，只包括市场份额至少占有关州 1.5% 的计划。平均而言，受益人在某一年面临 11.9 个计划的选择，93.7% 的人坚持前一年购买的同一计划 (默认计划)。这与之前对医疗保险 D 部分选择行为的研究相一致。

在给出模型的结构性估计前，作者对个体在年是否转换计划的指标与默认计划的属性和替代计划的平均属性 (包含年份和受益人固定效应) 进行面板回归，以简要证明部分惯性是由于默认计划和替代计划的特征不对称性导致的注意力不集中所驱动：

其中，是表示个体是否换掉默认选项的二元变量，表示非默认计划对的平均影响。文中，作者直接令等于价格最低计划对默认计划的影响。

所有模型都包括个体效应和时间固定效应。在所有情况下，报告的系数是基于默认和其他计划属性的不同差异下默认属性的系数。三列分别为竞争计划的不同认定方式。第一列认为是所有非默认计划的加权平均值，其中使用新受益人的选择来计算权重。第二列使用三个价格最低的计划的未加权的平均属性。第三列使用最低价计划的属性作为竞争计划的属性。回归还包括表征医疗计划是否缺少前 100 种药物、成本方差的相互作用和个人是否索赔的变量。

结果显示，在所有模型中，转换医疗计划对默认计划的保费和免赔额的敏感度都明显高于竞争计划的属性 (关于保费，对默认计划的敏感度几乎是竞争计划属性的三倍)。许多消费者在每个时期都不主动改变，但如果默认计划变得足够糟糕，就会被诱导做出主动选择。在这种情况下，默认计划的属性通过效用和促使消费者主动选择来影响选择。

为了量化有限理性与效用在合理选择医保计划中的重要性，该部分选用了文章设定的混合模型。即消费者要么“沉睡”，选择默认的医保计划。如果默认的医保计划变得足够坏，他们就会“醒来”，做出积极的选择。假定个体在时刻选择计划的效用为：

其中，表示源自计划特征的效用，表示效用相关的医保计划转换成本。

混合模型报告的系数中包括整体效用的系数以及 DSC 模型和 ASC 模型分别对混合模型的组成系数。回归同样包括表征医疗计划是否缺少前 100 种药物、成本方差的相互作用和个人是否索赔的变量。

结果显示，在不考虑注意力的条件 Logit 模型中，消费者对保费的权衡比自付费用更重，即使通过自付费用控制了这些自付费用的财务影响，消费者似乎也对计划属性有反应。绝大多数消费者可能选择默认计划。在条件逻辑模型下的适应成本为 1,224 美元。

接着利用 alogit 对同一样本进行混合模型的估计。考虑有限的注意力后，该模型下的适应成本为 287 美元，不到假设充分考虑的成本的四分之一。在条件 Logit 模型的估计结果中，消费者是喜欢风险的。然而，考虑到有限的注意力，他们似乎是规避风险的，消费者对计划属性的反应比条件 Logit 模型所暗示的要大。

出于上述保险计划选择模式的惯性，Handel 和 Kolstad (2015) 提出了“智能默认”政策——如果个人从这种转换中获得的货币收益超过某一阈值，则将其转换为每年可用的最低成本计划，所有参保者都将保留选择退出默认计划的能力，切换回原来的计划，或选择任何可用的替代计划。该政策尚未实施。文章依靠现有数据和设定的模型来预测消费者对政策的反应，并对结果进行规范评估。

此表中的“智能默认”政策为默认选择市场上价格最低的医保计划。每一行为不同关注概率对“智能默认”政策直接影响不同假设的结果，每一列为不同关注成本的假设。

结果表明，尽管医保 D 部分中的大多数惯性是由疏忽造成的，但仍存在与效用相关的显著调整成本。文章模拟了“智能默认”政策的福利效应，发现消费者改为较低成本的计划可以产生巨大的收益。这与预测“智能默认”政策不会对选择行为和消费者福利产生影响的假设充分考虑的模型形成鲜明对比。

3. 总结

大量模型表明，偏离 Slutsky 对称性是有界理性的表现。Abaluck 和 Adams-Prassl (2021) 的建设性识别结果采用了 DSC 和 ASC 模型的加强结构，从离散选择数据中识别出考虑概率，提供了分析各种环境下改变默认值的政策的通用经验框架。

模型揭示向默认选项的转变是由于不专注。通过允许“觉醒”个体在一定范围内考虑替代选项，模型避免了夸大与效用有关的转换成本。该模型是根据数据估计注意力概率。如果没有明确的注意力微观基础，我们无法预测改变潜在的背景时注意力会如何转移。但应用表明，模型的福利结论对关于这种转移的其他假设是可靠的。该考虑集模型在未来的相关政策场景中有机会大展身手。

4. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh logit probit, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：Probit-Logit

丁雅文, 2021, Stata：面板混合选择模型-cmxtmixlogit, 连享会 No.748.
万源星, 2020, xtpdyn：动态面板Probit模型及Stata实现, 连享会 No.44.

专题：Stata命令

吴小齐, 2023, Stata：如何理解非参数估计, 连享会 No.1287.
吴思锐, 2020, Stata：二元Probit模型, 连享会 No.162.
展一帆, 周依仿, 2021, Logit-Probit：非线性模型中交互项的边际效应解读, 连享会 No.616.
庄子安, 2021, feologit：固定效应有序Logit模型, 连享会 No.507.
张雪娇, 2020, Stata：Logit 模型评介, 连享会 No.212.
彭莘昱, 2021, reg2logit：用OLS估计Logit模型参数, 连享会 No.512.
朱菲菲, 2023, Stata：mscologit-一般化有序Logit模型, 连享会 No.1291.
杨柳, 2020, Stata：嵌套 Logit 模型 (Nested Logit), 连享会 No.260.
武珊珊, 2020, 详解 Logit/Probit 模型中的 completely determined 问题, 连享会 No.190.

专题：交乘项-调节-中介

祁本章, 2021, Logit-Probit中的交乘项及边际效应图示, 连享会 No.575.

专题：Stata入门

连享会, 2020, Stata 200 问：常见问题都在这里了-UCLA FAQs, 连享会 No.467.
连享会, 2020, Stata新命令：面板-LogitFE-ProbitFE, 连享会 No.341.
连享会, 2020, Stata：何时使用线性概率模型而非Logit？, 连享会 No.206.
连享会, 2020, 司继春：二元选择模型与计数数据, 连享会 No.148.

专题：回归分析

连玉君, 杨柳, 2020, Stata: 边际效应分析, 连享会 No.64.
连玉君, 杨柳, 2020, Stata：Logit模型一文读懂, 连享会 No.170.

专题：面板数据

郭盼亭, 2022, Stata：面板Logit的边际效应和处理效应估计-mfelogit, 连享会 No.1127.
陈卓然, 2022, 全面解读Logit模型, 连享会 No.965.
黄彩虹, 2020, 二元选择模型：Probit 还是 Logit？, 连享会 No.235.
黄欣怡, 2020, Stata：多元 Logit 模型详解 (mlogit), 连享会 No.443.
黄熹, 2021, 秒懂小罗肥归：logit与mlogit详解, 连享会 No.573.

🍓 课程推荐：连享会：2025社会网络分析·线上
嘉宾：杨张博，西安交通大学
时间：2025 年 7 月 30-31 日
咨询：王老师 18903405450（微信）

连享会微信小店上线啦！

Note：扫一扫进入“连享会微信小店”，你想学的课程在这里······

New！ Stata 搜索神器：lianxh 和 songblGIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。