「机器学习之父」Jordan：Hinton等「思想领袖们」正在伤害年轻一代

【前言】AI 正以前所未有的速度发展，新的机遇不断涌现，如果你希望：与技术专家、产品经理和创业者深度交流，一起探索 AI如何改变各行各业。欢迎在文末扫二维码，加入「AI思想会」交流群，和一群志同道合的伙伴共同学习、思考、创造！

他是教出 Andrew Ng、Yoshua Bengio 的那个人，他亲历了机器学习从无名到主宰世界的全过程。而现在，他说 —— 这场对话让他最担心的，是「思想领袖们」正在伤害年轻一代。

如果要评选过去半个世纪对人工智能影响最深的学者，Michael I. Jordan 几乎无法被绕开。

2016 年，《科学》杂志将他列为「全球最具影响力的计算机科学家」。他是统计机器学习领域的奠基人之一，在图模型、变分推断、贝叶斯非参数方法等核心方向上留下了大量引用极高的基础性工作。他目前是加州大学伯克利分校电气工程与计算机科学系、统计系双聘的杰出教授，同时在法国 Inria 巴黎分部任职研究员。

更广为人知的，是他的学生名单。Andrew Ng（吴恩达），深度学习教育的全球推广者；Yoshua Bengio，深度学习三巨头之一、图灵奖得主；Zoubin Ghahramani，贝叶斯机器学习领军人物；Eric Xing，MBZUAI 校长、知名 AI 研究者；David Blei，主题模型 LDA 的核心发明人……Jordan 的门下，走出了一整代机器学习领域的重要建设者。

这次接受采访的节目是 MLST（Machine Learning Street Talk），主持人 Tim Scarfe 是一位长期关注 AI 前沿的播客人。

视频链接：https://www.youtube.com/watch?v=AREWYbVtX64&t=16s

访谈围绕 Jordan 去年发布在 arXiv 上的论文《AI 的集体主义经济学视角》（A Collectivist, Economic Perspective on AI）展开，但谈话的射程远不止于此 —— 涉及 AGI 炒作、硅谷思维的缺陷、数据市场的经济设计、不确定性量化，以及他对 Hinton 等「旧友们」转型为末日预言家的真实看法。

论文链接：https://arxiv.org/pdf/2507.06268

强化学习领域的奠基人 Richard Sutton 推荐了这个访谈，认为 Jordan 带来了一个有力而深思熟虑的视角。

以下是这场对话的主要内容。

「AGI 只是个公关词」：

我从来不认为自己是 AI 研究者

访谈一开场，Jordan 便亮明了立场，毫不拖泥带水。

「AGI 对我来说只是个公关词。它是一种扭曲。它让人困惑，尤其让年轻人困惑。」

他解释，「人工智能」这个词本身就有历史包袱。1950 年代 John McCarthy 等人提出这个概念时，背后有一套特定的方法论预设 —— 逻辑推理、符号系统。那套路径后来并没有真正走通。真正在工业界产生巨大影响的，是在那之后几十年里，从统计学、运筹学等领域慢慢生长出来的机器学习方法：决策树、最近邻、逻辑回归、隐马尔可夫模型…… 这些方法大多数压根不是从「AI」这个圈子里发展出来的。

「亚马逊的云计算，最初就是为了处理机器学习的工作负载而建的。供应链、金融、交通运输系统，都在大规模使用机器学习，直到今天也是。这才是我成长于其中的传统。」

然后大约五年前，「AI」这个词随着大语言模型的兴起卷土重来。原因很简单：这次模型的输出是人类读得懂的流畅语言，而不再只是预测供应链、商业、价格之类的东西。人们看到这个就觉得：「天哪，我们解决了那个古老的 AI 问题！」Jordan 说，如果把「AI 问题」的定义窄化到图灵测试，那勉强算是。但这不过是换了个输出格式，背后的机器学习传统一直都在。

「这种 AI 术语回归，对研究路径产生了扭曲效应，对我们如何思考商业模式也产生了扭曲效应。还不够，他们还得再造一个更宏大的流行词 ——AGI。」

但他真正想批评的，不只是词本身，而是这套词背后的思维定势。他说，那些自称 AI 研究者的人，往往其实没有一个清晰的目标。他们的逻辑是：人类是智能的，大脑是一台计算机，只要我们模仿它、放大它，好事就会自然发生 —— 然后就停在这里了。没有「我们要解决社会上的什么具体问题」，没有「这对谁有价值、以什么方式产生价值」，只有一个隐隐约约的「它会帮我们解决问题，然后大家就幸福了」。

「这就是硅谷的谈话方式。我离开那里，部分原因就是我厌倦了这种谈话。那里没有什么深度的长期思考。它变成了一场内卷赛，一场金钱竞赛。」

Jordan 说，他从来没有把自己当作 AI 研究者，他也从来没有读过一本 AI 的书。他的训练背景是统计学家和认知科学家。「但我乐于接受这个称谓，」他笑说。

「我们是社会动物」：

为什么 AI 需要经济学？

Jordan 提出这篇新论文的核心观点时，先反问了一个问题：当前很多 AI 研究者真正想实现的目标，到底是什么？

在他看来，今天相当一部分 AI 叙事背后，仍然是一个非常旧的想法：人类是智能的，大脑像一台计算机；只要我们模仿它、放大它、并行化它，它自然就会做出伟大的事情。问题是，话往往就停在这里了。

它没有进一步回答：我们究竟要解决社会中的什么问题？这项技术为谁创造价值？成本由谁承担？收益又如何分配？它只是隐含着一种期待：技术会替我们解决问题，然后人类就会幸福。

在 Jordan 看来，这不是严肃的工程思维，而是在用隐喻代替系统设计。

主持人随后提出了一个典型的硅谷式反驳：如果像 Ilya Sutskever 这样的硅谷 AI 领袖认为，只要把 LLM 组织成多智能体系统，经济学里的那些复杂性就会自然涌现，Jordan 会怎么看？

Jordan 的回答毫不客气：「这就好像 1940 年代的化学工程师说，我们把一堆东西扔在一起，让它自己工作就好了。你确实可以这么做，但你会得到很多在经济上根本不可行的东西，还会伤害很多人。」

他认为，这一代 AI 建设者缺少的，不是智力，也不是代码能力，而是概念和思想的深度。他说，每一个上一个时代的工程学科 —— 电气、化学、机械 —— 不光有能动手的人，背后都有一套基础方程支撑：麦克斯韦方程组，牛顿定律。「现在这个领域有什么？只有非常聪明、会编程、有很多直觉的人 —— 我从没感受到任何真正智识深度的东西。感觉就像科幻小说。」

更让他担心的是，已经有人被伤害了，但没有人在谈这件事。Facebook 损害了大量青少年的心理健康，这从来没有被计算机科学家认真讨论过。现在又来了新一轮的「就业岗位可能会消失，但没关系，新的会出来，一直都是这样」——「我不喜欢这种说话方式。」

那么，Jordan 自己的框架是什么？他用了一个他反复强调的词：集体主义（collectivist）。

「当前这些技术，输入来自数十亿人，也将服务数十亿人。所以它本来就是一个集体性的东西 —— 有一个集体在输入，有一个集体在接受输出。这背后其实有一张巨大的、潜在的网络。」

但主流 AI 思维的根本缺陷在于，始终把智能窄化为了个体认知。把人类大脑当成模板，把神经元和梯度下降当成核心隐喻，却忽略了一个最基本的事实：人类是社会动物，我们大量的智识来自聚合 —— 聚合观点、思想，形成文化，文化在时间上保存它们。

更重要的是，社会为我们的智识提供了语境。在这个语境里聪明的行动，换一个语境可能就是蠢的。智能本身高度情境化，也高度依赖当下。

所谓语境，就是外面可能有人正在试图利用我，也可能有人想和我合作，而我并不真正知道对方的意图。所以我必须试探，必须发出信号，必须设计一些机制，让我们能够有效互动。经济学正是以一种数学化的方式研究这些问题。

这让他得出结论：如果不引入经济学和社会科学，我们就根本没有在讨论「完整的智能」。

他的框架最终落在三个顶点组成的三角形上：计算机科学（算法、抽象与模块化）、统计学（推断与不确定性量化）、经济学（激励机制与博弈均衡）。

「计算思维教会你模块化、抽象和 API—— 这是 Jeannette Wing 几十年前就提出的洞见，我完全认同。但大量算法其实不是从计算机科学原则里来的，它们来自统计学的推断思维：在不确定性下如何收集数据、如何做预测。再加上经济思维：周围有其他主体，如何确保激励机制是正确的。」

他说，只有计算加优化，你就只能得到语言模型。把统计和经济思维加进来，你才开始有一个完整的系统性思考框架。「我把这叫做这个时代的新文科核心。我的人文学科同事可能不同意 —— 但我认为，人文学科目前还没有触及这个时代真正核心的智识问题。」

「别问它是否理解」：

停止人类化机器

Jordan 在整个访谈里有一个反复出现的动作：每当对话滑向「AI 是否真正理解」「模型是否拥有某种内在认知」这类问题，他都会把问题拉回到更具体的层面。

「我们根本不需要去问这个问题。」

他回忆起 2000 年前后第一次去亚马逊时看到的景象。那时，亚马逊已经在用大规模机器学习方法 —— 当时叫随机森林 —— 处理供应链建模。系统能预测哪艘船会在印度洋延误，某些零件会不会准时到达，整个供应链每天把数十亿件商品送到一亿人手里。没有任何人类能理解那个大盒子里在发生什么。

「但这重要吗？不重要。你要问的不是它是否『理解』物流，而是：它能不能降低不确定性，能不能让工程系统建立在它之上，能不能让计划成为可能。这才是你要问的。」

他认为，「理解」「智能」这些词，是给媒体用的。媒体喜欢这些词，因为它们容易传播，也容易制造想象。而那些把 AGI、AI 术语推出去的人，他们心里很清楚，在自己的研究工作里根本不需要这些词 —— 他们只是知道媒体会接住。

「我们在自己的研究里根本不在乎『理解』这个词是否成立。我们想做的是建造好的系统。」

主持人提到，他上周刚采访了 AlphaFold 的核心研究者 John Jumper，问对方 AlphaFold 是否在某种意义上「理解」蛋白质。Jumper 的回答是：对这个词过敏。他说得很清楚 ——AlphaFold 让我们能预测，让我们能控制，但理解这个动作必须由人类自己来做，不能外包给机器。

这正中 Jordan 的观点。「为什么要说它理解？说它预测、它降低不确定性、它让实验成为可能 —— 这些已经足够惊人了。非得加上『理解』这个词，只会招来错误的期待，然后招来错误的失望。」

他认为，「人类化」机器这件事之所以有害，不只是因为不准确，更因为它会系统性地转移注意力。一旦你开始问「它是否理解」，就很容易忘记真正重要的工程问题：它在什么条件下会失效？它在哪些问题上最不可靠？它有没有给出误差范围？它如何与真实数据结合？它应该被嵌入什么样的系统？又该由谁来承担它出错的后果？

这些问题，才是真正决定 AI 能否进入现实世界的关键。

「那是媒体的问题，不是研究者的问题，我们不需要那个词。」

基础模型最危险的地方

恰恰是科学家最需要它的地方

Jordan 说他很钦佩 AlphaFold。他明确区分：AlphaFold 不像 LLM，它是针对一组特定问题设计的，并且在这些问题上做得极好。但他和团队做过一项分析，发现了一个让他真正担忧的盲点。

他们想研究一个假设：蛋白质中的量子涨落，是否与磷酸化存在关联。也就是说，那些结构上看起来「有点问题」的蛋白质，是否反而在细胞里更活跃？这是一个 2×2 的统计检验：磷酸化（是 / 否）× 量子涨落（有 / 无）。

用传统的已知晶体结构数据来做这个检验，样本量太小，根本没有足够的统计功效去拒绝原假设。换成 AlphaFold 预测的两亿个蛋白质结构，功效大幅提升，原假设被拒绝了 —— 看起来是好事。

「但我们发现，那个统计量的置信区间极其狭窄，而且整个区间都偏离了真实值很远。不只是在这一个问题上 —— 我们在一个领域接一个领域地发现了同样的现象。」

原因并不难理解：AlphaFold 的训练集里，含有量子涨落特征的蛋白质本来就很少，因为这个方向过去研究得不多，而且晶体化本身很难。训练数据稀少，就意味着 AlphaFold 在这个具体问题上的预测可能高度偏倚 —— 但它不告诉你这一点。它照样给出答案，照样看起来很有把握，但置信区间很窄，答案并没有真正覆盖真实值。

这才是真正让人不安的地方：不是模型答错了，而是模型答错了却不说。

Jordan 的团队为此开发了一种叫做「预测驱动推断」的方法 —— 把少量真实标注数据和大量 AlphaFold 预测数据混合使用，让置信区间在保持足够窄的同时重新覆盖真实值。技术上可行，AlphaFold 团队听到也不会觉得奇怪。

但他真正想说的，不是这个技术修复。他想说的是一个更根本的模式：

「科学家感兴趣的永远是知识边界上的新问题，不是把过去已知的事情再研究一遍。而基础模型恰恰在知识边界上表现最差、偏倚最大 —— 因为那里训练数据最稀少。」

这个矛盾不会随着数据增多自动消失。数据增多只会让模型在已知领域做得更好，但科学家问的下一个问题，依然会是在未知的边缘。「你可以修补，它会越来越好，但下一个新问题来了，同样的事情会再发生一次。」

他批评了两种常见的错误反应：一种是相信「偏差会随着数据增多而消失」，另一种是只批评架构、批评输出，却没有任何可以推进的科学方法。「那些人在说什么？他们在批评，但没有给出出路。」

正确的方向，是在任何基础模型周围，都建立起收集少量真实数据、融合进来、给出可信答案的能力。「这不是科幻小说。这是现在就可以做、而且真的需要做的事。」

超级智能与人类灭绝

不是仅有的两个选项

这是访谈里 Jordan 情绪最外露的部分。

他被问到怎么看 Geoffrey Hinton、Stuart Russell 等人描绘的图景 ——AI 正在递归自我改进，它是有主体性的，它不是一种文化技术，它是一个独立存在的东西。

Jordan 停顿了一下，然后说：「那是科幻小说。」

他补充：科幻对社会很重要，他不是在贬低它。但问题在于规模和音量 —— 当这些声音以那样的量级被推出去，当它们占据了播客、论坛、公众视野里所有关于 AI 的严肃讨论，它真的在伤害 20 岁和 25 岁的年轻人。

他说，这些年轻人对技术充满热情。他们想用它帮助自己的家人 —— 说实话，比帮助国家更想帮助家人。他们看到了真实的机会。然后他们听到了什么？

「那些领袖们说：我们已经玩够了。我们搞出了一堆算法，做出了这些东西。但你们不能做这个，因为太危险了 —— 它会以很高的概率消灭人类。或者：超级智能马上就来了，反正在你们有生之年也没什么事情可做了。」

「这太令人沮丧了。太令人沮丧了。」

他说，让他最不安的，不只是这种叙事本身，而是这种叙事背后经济思考的完全缺席。这些声音里，有零分的经济学。全是认知科学思维或神经科学思维：我们弄清楚了大脑，梯度下降加分布式神经元，LLM 能工作这么好本身就证明我们弄对了。

Jordan 对此的回答很干脆：你去问神经科学家，LLM 和大脑有没有关系，他们会说，那是一个好用的比喻，是一个卡通图，仅此而已。「梯度下降在大规模上有效吗？是的，远超所有人的预期。但它在暴露自己的弱点，而那些弱点是真实的。」

他更担心的，是劳动与资本的关系，而不是机器决定接管人类。「我没有看到任何迹象表明梯度下降会像病毒一样失控。那是隐喻，不是预测。」

然后是他最想对年轻人说的话：

「超级智能与人类灭绝，那不是仅有的两个选项。在那两个极端之间，有无数非常积极的事情可以在人类的尺度上完成。」

他说，现在的问题是年轻人缺少榜样 —— 缺少那种「靠做出真正有用的东西赚到钱、同时让世界变好一点点」的人。上一代有疫苗，有那些看得见摸得着的东西。「现在呢？不太好。」

他最后对整个公共对话的判断是：「这种思想领袖分成两队，一队冲向乌托邦，一队冲向末日 —— 在人类历史上，这种程度的现实脱节是非常罕见的。」

当你问 LLM「你确定吗」

它其实不知道

Jordan 认为，LLM 最根本的问题之一，是它对自身的不确定性一无所知。

问一个语言模型「你有多确定这个答案」，你得到的回答往往极端，要么极度自信，要么极度不确定，中间几乎没有梯度。Jordan 说，这不是在不确定性下推断，这是在模仿关于不确定性的语气。模型在训练数据里找到了人类在互联网上回答「你确定吗」的模式，然后复现那个模式。

他认为，「不确定性」本身被大多数人理解得太窄了。他把它分成三种完全不同的东西，需要完全不同的处理方式。

第一种是采样不确定性。这是经典统计学的领地：我观察到的数据，是不是足以支撑这个结论？但他用一个鸭子的比喻说明，即使是这种最基础的不确定性，一旦放进社会语境就会变形。

假设有一只统计学家鸭子，它发现湖的左边比右边有两倍的谷粒，也就是 2:1。一个纯粹做最大期望效用计算的贝叶斯鸭子，会每次都去左边。但真实的鸭子不是这样。它们大概会有 2/3 去左边，1/3 去右边，恰好对应那个比例本身。

这不只是对冲。Jordan 说，这是一个纳什均衡：如果所有鸭子都去同一侧，另一侧的资源就浪费了。鸭子是在种群语境下进化出来的，它的「不确定性处理策略」本来就是为整个种群优化的，不只是为个体。「正确地使用不确定性，意味着把它放在种群的语境里。」

第二种是信息不对称。你雇了一个专家，他知道你不知道的事，而且他知道的那些，他不会全部告诉你。这不是采样误差，这是一种结构性的、永远不会消失的不透明。经济学长期研究这个问题，比如合同理论、激励相容设计都是在问：如何在信息永远不对称的情况下，让系统还是能运转起来。

第三种他叫做「数据的时效性」（providence）。你在做手术决策，医生给你看统计数据，某种手术方案的存活率是多少。然后医生补了一句：那些数据是十年前收集的。你的不确定性应该立刻增加。但经典统计学不处理这个 —— 数据就是数据，它不会自动因为老旧而打折扣。「在一个真正的系统里，所有流动的数据都应该带着元数据 —— 它是什么时候的，这个元数据应该被定量地纳入不确定性计算。我们现在完全没有做这件事。」

人类其实很擅长把这三种不确定性混在一起处理，几乎是无缝的。你会说「那是老数据，我打折」，你会说「周围有其他人，我不能只优化自己」，你会说「他的动机我摸不准，我留一手」。而且你会在社会语境里主动寻找信息：如果不认识路，就去找一个看起来是本地人的人问。

「可怜的 LLM，上面这三件事一件都不会做。它说自己很确定，是因为互联网上有人在回答相似问题时说『我很确定』，然后它学了那个语气。」

他最后用了一个他很喜欢的类比来说明市场如何处理更大尺度的不确定性。

「如果我想开一家比萨店，我需要番茄。如果我每天都要自己去寻觅番茄，那今晚有没有比萨是高度不确定的。但因为存在一个市场，有人替我做了寻觅这件事，每天都有稳定的番茄供应，我的不确定性就消失了，我就可以在这个基础上建立更复杂的东西。」

市场不是因为有人设计了最优实验、做了多臂老虎机，它只是因为有激励让人去探索和利用，不确定性就在整个系统的层面上被消化了。「这才是真正大尺度的不确定性消解，不是误差棒。」

结语：

AI 是为了让人类做到本来想做的正确事情

访谈快结束时，Jordan 给出了他对 AI 本质最清晰的一次表述。

主持人问：现在那些担忧派和乐观派之间，有没有什么东西能让双方更新看法？

Jordan 没有直接回答这个问题。他说，他对 AI 本身是正面的，是乐观的，只是不是那种乌托邦式的乐观。

他用飞机做了类比。他小时候，空难很常见。今天，在如此大的规模下，商业航空的事故率极低，这是因为自动驾驶仪。飞机大部分时间由自动化系统控制，人类飞行员在需要时介入。这种人机协同，是目前已知最有效的方式。

「人类不是进化来驾驶这个大铁鸟的，所以你可以在这里改进人类的能力。把两者合在一起，你就得到了对所有人都有益的东西。」

他对比了自动驾驶汽车的思路。三维空间里有很多余地，但二维平面上你有几万辆车，每年每个国家几万人死亡。解决方案不是把超级智能放进驾驶座。「那是一种非常愚蠢的思考技术的方式。你必须从系统层面来想这个问题。」

然后他给出了他对 AI 真正功能的定义：

「AI 是关于帮助那些对人类来说太难的事情，帮助信息流动，让人类在当下能够做出大多数人真正想做出的正确决策，而不是因为信息不足，被迫做出他们害怕不得不做的错误决策。」

他说，人类是美好的，但也是不完美的。我们伤害彼此，往往不是因为恶意，而是因为误解对方的意图。有多少战争，是因为一方不了解另一方真正想要什么，就先动手了？「博弈论的出现，是为了帮助人类更清晰地处理这种情况，但我们还非常粗糙，非常初步。」

AI 真正的机会，他认为，是在 70 亿人的尺度上，帮人类修补那些进化没有完成的部分。「进化也许没有为 70 亿人的规模做好准备。」

所以，他真正担心的不是 AI 本身，而是今天那场被两极化带偏的公共讨论。一边是有钱、只想着建造的人，另一边是高喊「这会毁灭人类」却没有任何建设性的人。

「这两边都不是在认真思考，而在它们之间，有那么多真实的、美好的、可以做的事情。」

「那才是 AI 对我意味着什么。」

本文系学术转载，如有侵权，请联系后台删文

（👇 长按识别二维码）

转自：机器之心