社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

深度|GitHub CEO本周官宣离职创业:AI Coding 进入红海,但开发者工具领域不会只有唯一赢家,未来会是多元共存

Z Finance • 2 月前 • 142 次点击  

在最新一期 Decoder 节目中,主持人 Alex Heath 对话 GitHub CEO Thomas Dohmke,这场对话发生在一个微妙的节点:Dohmke 宣布将在年底离职创业,而 GitHub 则并入微软新组建的 CoreAI 团队。在 AI 编程赛道竞争白热化之际,这不仅是一场高层变动,更是一种战略重排,意味着 GitHub 不再只是“开发者社区业务”,而要成为微软 AI 工具链的底座。

面对行业内卷,Dohmke 在节目中给出了一系列激进且颇具争议的判断。他直言未来两年内 90% 的代码都可能由 AI 自动生成。当 AI 真能写出绝大多数代码时,程序员是否还必要存在?他的回答是:开发者不会消失,但会发生分化——有人转型为“提示语导演”,掌控 Agent;有人则坚守写代码的身份,成为“手艺人”。他甚至承认,这种分化本身就是一种新的“职业阶层化”。

更进一步,他提出一个引发热议的观点:AI 编程是通向超级智能的关键路径。如果 AI 能够自己写代码并优化自身,就意味着它具备了自我进化的能力,而这正是智能爆炸的前夜。在他看来,赢得 AI 编程赛道的公司,很可能率先掌握超级智能的门票。这一表态在行业内被视为既是雄心宣言,也是隐忧信号。

Dohmke 还抨击了围绕“AI 写了多少代码”的 KPI 游戏。他直言,这些百分比数据带有营销意味,真正的问题是:AI 生成的代码是否足够可靠、安全,能否在生产系统中大规模使用。他说未来开发者很可能会被“AI Agent 海啸”淹没——数万个 Agent 同时生成、提交代码,迫使人类开发者从写代码转向审核、治理。

他同样没有回避 Copilot 的竞争压力。Cursor、Anthropic 等对手正在重新定义“AI 原生工作流”,并迅速赢得早期开发者心智。Dohmke 承认这种冲击真实存在,但坚持认为 GitHub 的平台优势和微软生态协同,才是决定长期格局的关键。他把竞争比作 F1 赛车——不是每场都能赢,但真正的总冠军要看谁能坚持到赛季最后。

最终,这场对话把一个更尖锐的问题摆在台面上:AI 编程究竟是在解放人类,还是在重写人类在技术世界中的地位? 当 GitHub 的领导人选择在这个时间点抽身离开,留给行业的不只是 Copilot 的未来命题,更是关于开发者身份、智能边界与权力归属的巨大争议。

AI编程崛起与挑战:GitHub CEO谈未来两年内代码全自动生成的可能性

主持人:欢迎来到Decoder!我是Alex Heath,你们周四节目的特邀主持人,也是The Verge的副主编。本周是Decoder的AI编程专题周。你刚刚听到了我的朋友Casey Newton采访Cursor CEO Michael Trell的内容,而接下来,我将带来与GitHub CEO Thomas Dunka的对话。在很多方面,GitHub Copilot可以说是引爆了我们如今所处的AI编程热潮。

但自从Thomas一年前上过节目以来,AI编程的兴起已经让关注点转向了像Cursor和Windsurfing这样更新的平台。正如你们将在我们的对话中听到的,Thomas正在深入思考竞争形势以及GitHub和软件开发的未来。现在正是进行这场对话的好时机。Thomas对行业的走向有着鸟瞰视角。我想了解他如何看待AI对软件工程师角色的持续变化,以及他自己什么时候会觉得可以放心地进行AI编程。毕竟这是Decoder,我不能不问他如今作为一个独立于微软内部的公司,运营GitHub的生活是怎样的。好了,GitHub CEO Thomas Dunka,开始吧。

Thomas,非常感谢你来参加节目。自从你一年前和Nile一起上Decoder以来,我有很多事情想和你聊。自去年以来,最大的变化就是我们在The Verge和Decoder上不断讨论的AI编程的兴起。作为一个从未写过任何软件的人,当我想到AI编程时,觉得那将是我能够完全不用懂代码就能创建一个应用或网站的时刻。对我来说这非常令人兴奋,但感觉我们还没完全到那个阶段。行业大概什么时候能达到那种程度,让像我这样的人可以从零开始用AI编程创建东西?

Thomas Dohmke:这完全取决于你想要做什么。对于一些小项目,我们已经达到了那个阶段。我挑战你去试试GitHub Spark或者Lovable,你很可能能做出像贪吃蛇、乒乓球或者一些小型的专用应用。我们现在已经到了那个水平。

随着复杂度的增加,你就需要具备一定的系统理解,比如架构设计、数据库等等。我们越来越接近这样一个阶段,越来越多的基础功能——我们称之为primitives——被这些AI编程平台所支持。举个例子,像GitHub Spark,当我们去年十月在GitHub Universe发布它时,它只能创建运行在浏览器里的前端应用,使用的是JavaScript语言,可以做一些浏览器端的操作,并带有一点后端存储功能。而现在新版的GitHub Spark实际上可以生成一个完整的全栈应用,包含后端和数据库,还能连接AI模型等功能。大约九个月的时间,它变得越来越复杂。我相信我们会看到这些AI编程平台生成能力的指数级提升。

挑战在于,从零开始创建东西是一回事,而去修改一个已有的软件系统、弄清楚代码库中哪个功能对应哪个测试用例则是完全不同的事情。大多数软件应用随着时间推移会变得越来越庞大和复杂,可能有成百上千的工程师参与开发。AI要能解决所有这些由系统专家才能应对的用例,离我们还很遥远。

主持人:这正好引出了你最近发表的一篇博客文章,你采访了一些开发者。我很想知道他们是什么类型的开发者。你采访了一批开发者,了解他们对AI编程现状的看法、他们目前的状况以及他们对未来的预期。你都采访了什么样的开发者?这些人不全是你们团队内部的。他们是外部的开发者?

Thomas Dohmke:是的,都是外部开发者,是真正在写代码的人。七年前我第一次接触GitHub时,感触很深,因为GitHub品牌和它在业界的广泛知名度,让我们很容易找到愿意参与30分钟访谈、回答问题的人。所以我采访的开发者有一定比例是与GitHub有联系或者对给我们反馈感兴趣的,但总体来说,采访对象是非常多样化的。

主持人:你收到的最主要反馈是什么?我想把这个和软件工程师的角色变化联系起来,想了解你从大家那里听到的关于工程师角色现在如何变化,以及如果可以的话,他们认为未来一年这个角色会怎样演变。

Thomas Dohmke:有人很快地说,AI已经来了,而且会长期存在。我们采访的大多数开发者以及整个行业的大部分开发者,都已经意识到软件开发这个职业正在发生变化,尤其是那些使用AI的开发者,这种变化已经在进行中了。因此,大多数人都在调整自己的工作方式。今年早些时候我写过另一篇博客,称这为“开发者的奥德赛(the Odyssey of developer)"(ZP注:“开发者的奥德赛”借用古希腊史诗《奥德赛》的意象,形象地描述了软件工程师在AI时代面对技术变革时,经历不断适应、探索与成长的漫长且充满挑战的历程。)

我们经历了从穿孔卡和大型主机,到个人电脑的变迁,这极大地改变了开发的内循环速度。以前我得预约主机时间,我记得去我妈妈办公室时,她桌上堆着穿孔卡,而突然之间,每个人的桌上都有了个人电脑,至少护士们开始用电脑编程。接着,我们经历了从汇编语言、Basic和Pascal到Python、Go和Ruby的演变,从没有互联网到拥有数百万个开源库,能直接从自己的服务器或云端拉取到应用中。技术一直在不断提升抽象层次。

如今,开发完整全栈应用的工程师很可能并不真正了解运行该应用的CPU型号、内存大小、主频等具体硬件参数。除非是游戏开发者,他们通常也不会写汇编代码。技术堆栈自然在不断向上发展,因为我们管理的代码量在过去50年呈指数级增长,未来也会继续这样增长,人类已经处在指数曲线上非常陡峭的阶段。因此,我们需要这些工具来“拉平”这条曲线,虽然不能让它完全平坦,但至少让它不那么陡峭,这样我们才能继续应对如今拥有数十亿行代码的复杂应用。

主持人:你采访的开发者中有一半表示,他们相信在两年内,90%的代码将由AI完成。这也是我从其他人那里听到的观点。Anthropic的CEO Dario Amodei甚至给出了更激进的时间表,他认为三到六个月内就能实现。我很想知道你怎么看这个问题?实现一个几乎所有生产环境代码都至少部分或完全由AI生成的世界,大概需要多长时间?

Thomas Dohmke:每当谈到这个话题,我首先想到的是,我们现在技术栈中90%的代码其实已经是别人写好的,也就是全球数百万开源开发者的贡献。无论是前端网页还是后端,我敢肯定90%都是开源的。按代码行数算,90%来自开源库、开源操作系统、编程语言和各种依赖,而工程团队只负责剩下的10%。GitHub和微软的情况也是如此。我们已经处在一个世界里,专注于定义业务核心的那层薄薄的上层代码,同时借助全球开发者的力量来加速创新和安全保障。AI也会做到类似,写出90%的代码,而我仍然可以专注于自己8小时的工作,写好那10%的代码。这并不意味着我停止写代码,而是意味着我现在能拥有十倍于自己单独完成的代码量、功能和特性。

主持人:这就像开源推动技术进步一样,AI也是对开发效率的巨大放大器。

Thomas Dohmke:我们会看到各种团队和公司的广泛差异,这不仅取决于他们是否愿意使用AI,还取决于他们如何设计公司、软件和基础设施,使AI Agent能够充分利用这些资源。举个例子,如果他们有设计系统,当你让Agent添加功能时,它不会随意创造新的层叠样式表,而是使用已有的组件。这样Agent构建的所有功能都能与产品的设计语言保持一致。可以想象,一种全新的应用架构方式将出现,让Agent像搭乐高积木一样更容易组合新功能。这将极大地影响公司达到90%代码由AI编写这一目标的速度,反过来也会影响AI的应用。

显然,仍有许多公司运行着基于大型主机的老旧代码,使用PHP、Perl等遗留的“意大利面条式”代码库。以GitHub为例,我们有一个和GitHub年龄一样大的Ruby on Rails单体应用。作为CEO,我不能简单地决定去拆分这个单体架构,更别提这往往不仅是工程问题,更是哲学层面的讨论。摆脱这些遗留系统,经历云转型、数字化转型,现在还有AI转型,对于这些组织来说所需的时间远远超过那些能够站在技术前沿、让90%以上代码由AI生成的公司。

主持人:所以听起来你还没有具体的时间线。

Thomas Dohmke:比如现在,很多人在他们的博客里已经在记录这件事了。如果你知道自己在做什么,并且从零开始用类似Claud code这样的工具,你可以让100%的代码都由AI生成。而你唯一需要做的,就是修改这些用自然语言写成的指令文件,来指导Claud code构建应用。所以这个应用从定义上来说,100%的代码都是AI写的,而作者真正写的只是指令规范。如果生成的源代码不能正常运行,你当然可以进去手动修改,或者你也可以选择不去修改,因为那样可能会破坏系统,而是思考如何调整你的指令文件,让Claud code继续帮你写出所有代码。

主持人:说实话,我有点懊恼自己居然问了你这个问题,因为有些CEO说“我们代码中有多少百分比是AI写的”这种说法,实际上让我很烦躁。你的老板Satya Nadella曾表示,微软大约有20%到30%的代码是由AI编写的,你也知道,Sundar Pichai也发布过相关数据。

AI编程工具普及与质量挑战下开发者的疑虑与角色转变

主持人:Marc Benioff发布过相关数据,Mark Zuckerberg也有类似说法。但我一直在想,这些代码到底质量如何?

这是那种你希望随着时间推移不断增加使用比例的代码吗?我看到最近Stack Overflow做的一项调查,采访了很多开发者,我相信你也看过。很有趣的是,绝大多数开发者表示他们已经在使用或计划在明年内使用AI工具,比例超过80%。但更有意思的是,大约一半的受访者表示他们对这些AI编程工具的准确性持怀疑态度,而他们最大的挫败感——调查中约66%的人提到——是AI生成的代码常常不够准确,导致他们不得不花大量时间调试。

而且AI编程实际上花费的时间比带来的生产力提升还多。我想知道你在GitHub的各项工作中,包括GitHub内部,是否也看到类似情况?还是这只是个别现象?这看起来是个很大的问题——虽然AI生成的代码越来越多,但质量可能并不理想。

Thomas Dohmke:你说得没错,不过我没给出具体的百分比。

主持人:说实话,我有点懊恼自己竟然只是问你这些百分比问题,因为我翻看笔记时发现,其实很多人对这些百分比数据持怀疑态度,我们是不是用错了讨论的角度?确实,AI生成的代码量在各家公司不断上升,CEO们也拿这个来炫耀他们的成果,但我们是不是该更多关注代码的质量?我很想听听你对这场讨论的看法。

Thomas Dohmke:从我角度看,这两者其实是相辅相成的。这些百分比多少带点营销成分,具体是90%、80%还是95%其实没那么重要。重要的是,我们必须清楚软件开发这个职业正在发生变化,技术堆栈在不断提升。我们正在从理解每一行代码,转向更多地在规格说明之间切换。

人类语言本质上是非确定性的。我们俩可能说同一句话,但意思却不同,更别说不同语言在描述事物时用的结构也不一样。编程语言其实是对处理器——无论是CPU还是GPU——的一种抽象,本质上就是描述晶体管如何自动切换从0变到1的过程。这两者都会共存,因为机器依然运行在CPU上,这一点不会变,但我们是用人类语言在思考。

所以问题其实是,你想写更多的人类语言,还是想写更多的代码?这不是AI帮你决定的,而是你作为开发者自己做的选择。这正是作为开发者的创造自由——你可以说“我现在知道自己在做什么,我想写代码”,或者“我想用AI Agent帮忙”。事实上,关于Agent,最关键的问题是,用Agent更快,还是自己动手更快?如果我知道自己三秒钟就能搞定,那用Agent反而是浪费时间、精力和资源。就像我希望用ChatGPT帮我回复短信一样。

主持人:我用消费者级Agent的时候也有类似感受,比如你确实能帮我订酒店什么的,但花了一个小时,而且结果也不太对头,最后我还是得自己动手做,自己做反而更高效。

Thomas Dohmke:就拿Outlook里的通知摘要来说,至少对我而言,它通常没有直接阅读邮件的前三行内容来得实用。

接下来第二个问题是,好,AI写了这么多代码。如果AI写了90%的代码,也就是写的代码量是我自己的九倍,那么我是不是要审查这些代码的质量、安全性和编码规范?还是说,我会寻找AI来帮我做这些工作?因为最终,我们人类开发者将被大量Agent“淹没”,这里说的“淹没”是分布式拒绝服务攻击(DDoS)的意思——这些Agent不会休息、不会周末放假,而且可以同时运行。

你看OpenAI的codecs,它们已经会为你给出的每个任务生成四个不同的版本,然后你通过选择自己最喜欢的版本,实际上在帮助它们进行强化学习。但不仅仅是生成四个版本,它们完全可以生成40个甚至400个版本。接着,你还可以用另一个Agent来评估这些代码的质量,给出评分,形成一个Agent之间相互反馈的闭环。

实际上,我们正逐渐达到一个阶段,AI Agent生成的代码质量会持续超越人类,因为它们可以在无限规模上运行,找到那些人类因时间有限而无法发现的所有漏洞。但挑战仍然存在,那就是我们是否信任这些代码。说到这点,其实GitHub的诞生正是为了促进人类之间的协作。

GitHub的核心就是我有一个开源项目,你可以fork这个项目,如果你喜欢或想添加功能,就给我发一个叫做pull request的请求,然后这代码不会直接合并到我的代码库里。相反,我会审核这段代码,给你反馈,比如说:“嘿,Alex,这个挺不错,但你能不能改写一下这部分?”有时候语气甚至会更严厉。最终,我们会决定,“好,这挺不错,合并吧。”这其实就是人类之间协作的质量控制。当然,你也可以用同样的流程来实现人类和Agent的协作,但如果你有成千上万个Agent,那就得重新思考这个流程了。这将是开发者工具最大的差异点——谁能搞清楚如何让Agent生成比人类多得多的代码,同时又让人类保持控制权,确保投入生产、处理客户数据、计费流程等的代码真正可用、质量过关且没有安全漏洞。这才是未来几年的挑战,不是Agent写多少代码,而是我们能接受多少Agent写的代码进入生产系统。

主持人:听起来你的意思是,未来的开发者更多是在全天监控这些Agent的表现,接受或拒绝pull request,审查代码,但不再亲自写代码,可能只给出非常高层次的指令,实际上是在从编码的具体过程里退出来。这将成为普遍的趋势吗?

Thomas Dohmke:你要做的只是写一个提示语。这在图像生成模型中也已经开始出现了。比如你用ChatGPT生成一张吉卜力风格的图像,你并没有写生成图像的代码,只是给出指令,然后模型帮你完成。实际上,有个技巧是你可以上传一张已有的图像,让它分解成JSON格式的数据结构,然后你修改这个数据结构,再用它作为提示语去生成修改过或删除了某部分的图像。所以你有点像在做开发,但并不写代码,而是让模型帮你完成。未来会有一类开发者,专门使用模型和Agent来构建并验证系统。

还会有一类开发者依然热爱写代码,他们会将部分工作交给AI Agent来完成,比如写测试用例、文档等那些他们不喜欢做的事情,从而腾出时间去做自己真正热爱的事。问题是,你一天八小时的工作时间应该如何安排?什么样的工作能激发你的创造力,推动创新,还是更注重把事情做完?这两者需要结合起来。

如今,无论大公司还是小公司,大多数开发者每天可能只写四个小时代码,有时甚至更少。剩下的时间则花在开会、写邮件、审查他人代码、更新服务等各种事务上。开发者还得做很多其他工作。他们大多数人会保留一定时间,用来写代码或者写指令生成代码,这会让他们感觉自己依然在编程。

事实上,打个比方,我们是从汇编语言发展到更高级的AI编程语言和开源库的。我没见过有人说自己再也不用写汇编了,并不是汇编不再存在,而是我们有了编译器,把高级编程语言编译成汇编代码。现在,你可以把AI模型看作是一个编译器,它把人类语言的指令编译成编程语言,然后真正的编译器再把编程语言转成汇编代码。你的代码其实就是人类语言了。你可能再也不用看编程语言了。但问题是,目前的模型仍然会出现幻觉,写出的代码不一定完全符合你的预期。

或者说,我可能会让AI重复生成十次,每次的代码版本都不一样。你看过有人在现场用vibe coding演示玩贪吃蛇游戏吗?每次生成的游戏代码都不一样。所以我们还不够信任人类语言转换成编程语言这一层,无法直接跳过它。但我们已经成功跳过了汇编语言那一层,对这点很有把握。我认为只要这两层依然存在,我们就会继续写代码、学习编程,在确定性和非确定性层面之间来回切换。

主持人:因为LLMs本质上是非确定性的,它们会“编造”内容,这其实是它们架构上的一个特性,而不是bug,是故意设计成会产生幻觉的。那么,是否会有那么一天,像我这样完全不懂编程、分不清各种语言的人,也能可靠地通过自然语言构建需要访问各种API、数据库、网页等功能的应用?如果真的能做到,那将是个巨大突破,对世界产生深远影响。但正如你说的,也许这项技术本质上就达不到那个境界。

Thomas Dohmke:只要范围受限,是能够实现的。而且这个范围会逐渐扩大。

你将能够完成一些特定的任务,比如你现在跟AI Agent对话,让它帮你生成一张图表。实际上,它是在帮你写一段Python脚本,然后用这段脚本来生成图表。而你可以让ChatGPT把这段Python脚本展示给你看。不过大多数用户根本不需要去理解这段Python代码,只要看图表就行了。所以这类用例会快速增长。

但我们所认为的专业软件系统,也就是专业软件开发者开发的产品,将变得更加复杂。因为现在专业开发者能够在同样时间内构建更多功能,而过去可能只是写一个Python脚本来生成合理的图表。今天我们所称之为“最先进”的软件,将远比我们能想象的人类开发者写出的复杂得多。事实上,这一直都是如此,比如现在我的iPhone,功能远远强于1990年代初的Commodore 64。当年为Commodore 64开发的程序员看到如今的iPhone应用,会觉得这简直是魔法,就像我们看待AI一样。如果这样想,我们终会达到那个点,同时专业开发者依然会像魔法师一样,因为他们能写出如此精简且功能强大的应用。

GitHub Copilot与AI编程领域的激烈竞争与未来展望

主持人:我们来聊聊竞争吧。你刚才在对话中已经提到了几个GitHub Copilot的竞争对手,这说明你愿意谈这个话题。编程可以说是目前AI领域竞争最激烈的部分,至少这是我的看法。现在有很多交易在进行,初创公司被收购,实际上,一些历史上增长最快的公司正是AI编程公司。比如Cursor、Lovable,还有我们刚才谈到的Vibe coding应用。

GitHub Copilot确实是最早进入AI编程助手领域的产品,现在依然非常强大,但我好奇的是,特别是过去这一年自你上次在Decoder出现以来,你是否认同这样一种看法——GitHub Copilot似乎在一定程度上失去了市场关注度,至少在那个对这类技术痴迷、每天都在讨论的硅谷小圈子里。我相信你们仍然有大量用户,但我想知道你是否也有这种感觉,是否觉得这对你们推动产品更快迭代带来了压力?另外,你怎么看今年竞争格局的变化?

Thomas Dohmke: 整个人工智能、大型语言模型以及这些模型能实现的可能性正以非常快的速度发展。在科技领域,我从未见过这样的局面,我也在这个领域待了很久。你说得没错,AI代码生成正站在这场创新浪潮的最前沿。逻辑上讲,因为所有这些公司都雇佣开发者,所以大家都有内在的动力让编程变得更容易,因为这意味着我可以更快地创新。如果我有一款能让我的开发者比竞争对手快5%的编程工具,我肯定会用。自从我上次在Decoder亮相以来,这个市场已经加速发展。我对此持非常开放的态度。

这真是令人惊叹,我作为开发者这么久,从未见过软件开发工具有如此多的创新。作为GitHub,我们一直明白自己是一个生态系统的一部分,这个生态系统既与行业内的公司竞争,也与它们合作,无论是在AI代码生成领域,还是在CI/CD、应用构建等方面。我们并不决定你更喜欢哪个开源库。大多数人不会只用GitHub提供的JavaScript生态系统,如果你想用Python,你会去别处。没有人愿意看只有一支球队赢球的体育比赛。至于你说我们失去了心智份额,我不同意。我们赢了一些,也失去了一些,有时甚至是周周变化。你会看到有人在他们的社交媒体上发帖说他们又回到VS Code了,因为最新版本、我们每月发布的90个版本中有他们想要的功能。作为行业,这是值得骄傲的事情。

Copilot在从单模态到多模态的转变上起步较晚,但我们去年十月终于实现了这一步。我们引入了AIC支持,构建了MCP(模型上下文协议)集成,现在所有这些编程代理都在使用我们与OpenAI合作打造的GitHub MCP服务器。这是一场竞赛。我们刚刚在微软的财报中宣布,GitHub Copilot现在拥有2000万用户,环比增长达到75%,在企业使用方面,财富100强中有90家在使用。关于数据统计,我可以一一告诉你。

主持人:关于用户数量,我得问问你这个数据。Thomas,这个用户数量听起来有点奇怪。这是累计用户数吗?还是曾经使用过的用户数?还是月活跃用户?或者是日活用户?你能给我更具体一点的细节吗?

Thomas Dohmke:这是指有2000万GitHub用户开启了Copilot功能。这个数字对应的是GitHub总账户数1.5亿的计算方式,测量方法是一样的。另外,我们在Visual Studio Code上有5500万用户。所以这些数据可以让你大致了解我们在各种IDE中激活用户的情况。

主持人:你那篇宣布新用户数统计的帖子里,你写道,一家公司的真正考验从来不是在它的炒作浪潮中显现,而是在压力测试时展现出来的韧性。然后你还写了更有意思的一句话,是你说“即使面对各种限制,我们也证明了少许坚韧能赢得比赛”。你在那篇帖子里说的那些限制具体指什么?因为你是GitHub的CEO,我本以为你们其实并不受限制。你们还是model agnostic(模型无关)的,而微软其他部分似乎至少目前还和OpenAI紧密联系着。但看起来你们能用任何想用的模型,相较微软其他部门还是比较独立的。你说的那些限制具体是什么?

Thomas Dohmke:公司的资源是有限制的。这就是预算的定义。员工人数,或者说人头数什么的。你不可能无限制地一直增加人员,因为那会遇到“人月神话”问题(Mythical Man-Month Problem)(ZP注:"人月神话"问题指的是在软件开发中,盲目增加人手并不能线性缩短项目工期,反而因沟通与协作成本上升导致进度放缓的现象,来源于弗雷德里克·布鲁克斯1968年出版的《人月神话》。),增加更多人反而会拖慢团队速度,而不是加快进度。无论你是10人的初创公司,还是3000人的GitHub,甚至是20万人的微软,都必须做出取舍。

苹果公司也著名地说过,每个“Yes”需要1000个“No”。所以其中一个限制是,我们的待办事项清单中有无穷无尽的条目,而且很多这些待办项的差距都是源自AI出现之前的时间,比如客户反馈,有人在GitHub Issues或者GitHub Projects里希望有某个功能,你说得出名字的,我们都有。

事实上,有个流传的笑话是,我们每收到一条客户反馈,实际上早就有一条类似的,可能是几个月甚至几年前的,别人早就有了同样的想法。因为我们的客户群体是开发者,我们自己也是开发者,总会有人提出之前已经存在的想法,或者告诉我们如何做得更好。然后在X上(推特)就会有一拨人说,“GitHub把这设为默认是个愚蠢的决定”,另一拨人说“这是有史以来最棒的决定”。我们生活在这样一个信号输入过多的世界里,而我们的限制就是选择那些真正能让你快速前进的关键点。

而且没人真正知道两三年后AI代码生成或者AI整体会是什么样子。如果我们都诚实面对自己,这是真的。

如果说ChatGPT是2020年代的Netscape时刻,那么现在就像是1995年,当时有了Amazon和Google,但还没出现Facebook、Shopee和iPhone。1995年预测这些事物会发生,是非常荒谬的。

而GitHub自成立以来就是这样一种自信的状态:它走在时代前沿,比如最早使用Git来构建当时没人叫DevOps的东西,但现在它成为了最大的开发者平台之一。之后一直在寻找下一个重大创新,关注行业内其他人在做什么,他们更倾向于和谁合作,而不是自己全部打造。通过Copilot,我们很好地驾驭了这一点。也有过战略决策失误的时刻,那些决策没能把我们拉向正确方向赢得市场。但现在,我可以说,到2025年8月,我们依然走在曲线前端,依然是市场领导者。对此我们感到非常自豪和开心,这些都是我们辛勤努力的成果。

主持人:说到合作还是不合作,大家都知道,编码已经成为影响人们关注的巨大交易,尤其是和AI相关的。我想到Google和Windsurf。Windsurf是一个非常有前途的AI编程工具,他们本来打算卖给OpenAI,但那个交易被叫停了,而这正是微软介入的地方。我知道你是GitHub的,但这事都相互关联。我很好奇,这件事的关键是,为什么Google最终选择招聘了Windsurf团队,而Windsurf没能卖给OpenAI,原因是有人担心Windsurf的知识产权不会被保护免受微软影响,考虑到微软和OpenAI的关系,存在竞争动态。

所以我想知道,为什么这是一个如此重要的问题,以至于直接导致了那笔本可能对AI编程领域乃至整个硅谷都很重要的交易失败?这本来会是一笔数亿美元的大交易。虽然我知道你可能不是这件事的主要推动者,但你能解释一下为什么这件事如此关键吗?

Thomas Dohmke:你问这个问题我可以选择不回答。说实话,我在这些谈判中确实存在利益冲突,所以我没有任何内部背景信息可以分享给你。但这其实反映了另一点,就是担心开发者很快会被AI取代的恐惧其实是不成立的。事实恰恰相反。像Windsurf背后的创始团队和核心成员,或者行业内的其他人,我自己也想到我本人,他们收到的报价已经能和职业篮球运动员媲美,有些人甚至有经纪人帮他们谈合同。对此我们应该感到兴奋。

至于如何达到这一步,是个好问题,适合有渠道接触相关文件的人去探讨,我没有那权限。但作为一个开发者,一直在这个行业里,自己也在构建和使用开发工具,这真的是非常令人激动的事情。因为这说明顶尖开发者的市场价值在不断增长,也希望能激励那些喜欢玩游戏、想自己创造东西的青少年,继续投身这个职业。我坚信,如果事情按我希望的方向发展,我们将比以往任何时候都更需要更多开发者。

主持人:我们具体聊聊Cursor吧,它真的扛起了大旗,至少在硅谷的早期用户群体中,它是目前最火热的AI编程工具。他们抓住了什么关键洞察,才让他们在用户心智认知上迅速领先?我知道GitHub Copilot规模还是更大,但Cursor增长非常快,而且他们的CEO最近在Dakota和Casey Newton的采访中提到,GitHub是他们创业的灵感来源。那他们到底抓住了什么是你之前没看到的?你们现在怎么应对?

Thomas Dohmke:Cursor抓住的关键是认识到,问题不仅仅是把AI加入到传统的集成开发环境(IDE)里,而是要改变整个IDE本身,设计一种你可以称之为“AI原生”的工作流。换句话说,就是从根本上思考如果AI是默认配置而非附加功能,开发者将如何工作。他们是第一个基于GPT-3.5版本开发的Copilot产品。

所以他们还走在前沿,意识到应该让多模型共同发挥作用,给开发者选择权,让他们挑选最适合自己的模型,而不是我们替他们做决定——这就是我一年前和Nilay谈话时我们的理念。这是两种不同的思路。我们当时做了大量进化测试,评估各种模型,然后选出我们认为最好的那个。但这不是非黑即白的选择,因为每种编程语言、每个测试场景,不论是生成功能代码还是测试代码,评分标准都不一样。于是会有不同的评分维度,你必须做出综合判断,认为“这个模型总体表现更好”。

不过根据开发者工具的发展历史,我们GitHub对此非常清楚,给开发者提供选择权永远是最好的做法,让他们自己决定用哪个模型。凭借经验,或者说专业直觉,他们会知道怎么选。这已经改变了今天的市场格局。如果你不提供多模型选择,不拥有被大多数开发者认可的最佳模型,不允许开发者带入自己的模型,没有运行在IDE中的Agent模式,不能将该Agent模式卸载到云端,像我们称之为“Coiled Coding Agent”的服务并且集成在GitHub平台里,你根本无法在AI编程领域竞争。

我很喜欢F1赛车,我总是用这种思维看待世界。有些车队赢得了整个赛季,下一季却落后了,他们不会因此认定“我们输了,永远不会再赢”,而是把这当作动力去重新思考自己的做法。这就是2024年中晚期Copilot经历的过程。而到了2025年8月,我们已经能重新赢得比赛了。虽然不是每场都赢,竞争对手也不会每场都输,但我们确实在AI代码生成上做出了创新,同时也赶上了让其他对手更快的关键技术。

主持人:这个领域看起来非常动态,正如你提到的,关键在于模型本身。无论哪个工具目前在模型领域领先,它们都会用自己的方式来定价模型,而模型领导者经常变化。即使身处其中,也几乎不可能跟上所有这些模型的发布节奏。

Llama3是个不错的模型,Llama4就不那么出色了;而Anthropic现在似乎是代码领域的王者。也许情况会变,也许几个月后OpenAI会重新领先。这会如何影响应用层呢?所以必须理解这个领域变化有多快。现在说你们肯定输了,或者说Cursor肯定赢了,都为时过早。但说到Anthropic,你们跟他们合作很多,你提到了MCP服务器,显然通过GitHub Copilot也可以访问云端。

我一直在问人,为什么Anthropic在编码方面这么强?他们有什么“秘密武器”?Dario(Anthropic联合创始人)最近在Big Technology播客上说,他不想透露他们为什么这么厉害。但这大概是一个价值数十亿甚至上千亿美元的问题——为什么他们在这个领域有如此领先的模型?作为一个和他们紧密合作的人,我很想知道你怎么看,为什么他们在编码领域取得这么大领先?

Thomas Dohmke:让我先回到你问题的第一部分,稍后再谈谈Anthropic到底强在哪里。

在科技领域,我们常有一种观念,觉得一个赢了就意味着另一个必输,但这并未被证明。比如Windows和Mac OS、iPhone和Android,以及许多其他技术,事实证明并非如此。实际上,在开发者工具领域,这种“非此即彼”的情况从未出现过,否则今天也不会有数十种编程语言存在,大家都会转向所谓最好的那一种。

看看GitHub Copilot的竞争对手,比如Cursor、Lovable、Windsurf、旧版Vercel等等,你会发现使用这些工具的人,其源码实际上都存储在GitHub上,他们的Issues和项目管理也在GitHub,CI/CD流程也是在GitHub上运行的,而这些竞争对手很多是在Azure上运行模型推理。作为微软的一部分,我们是整个生态系统的一部分。

我们一直是平台公司,GitHub也一直是平台公司,所以我们既是竞争者,也从这些公司推动整个软件生态系统规模增长中受益。说实话,软件开发只会越来越多,不会减少,开发者人数也在增加。看看那些科技公司在股市上的表现,它们经常跑赢大盘。如果我们的竞争对手赢了,我们其实也赢了。在谈论这些竞争时,保持这种心态非常重要。

主持人:这就是作为超大规模云服务商的优势,Thomas——当竞争对手赢了,你们其实也赢了。不是每个人都能这么说。

Thomas Dohmke:当然,这就是所谓的差异化。具体说到Claude Sonnet,如果你相信YouTuber、博主和专家们,比如Simon Wiles等人,他们认为Claude Sonnet真正胜过其他模型的地方在于“工具使用”——也就是模型为Agent模式的下一步选择合适工具的能力。这说明,训练不仅仅局限于编程语言、代码等内容,更包括训练模型像开发者一样合理使用各种工具。

如果这一步失败了——你可以在一些其他模型身上看到这种情况,工具使用远不如Claude Sonnet——那么你的Agent模式就会崩溃。举个例子,Agent需要安装一个JavaScript依赖的NPM包,但安装失败了。即使Agent拥有世界上最好的训练数据集,如果它完成不了这一步,整个流程就无法正常工作。Anthropic正是在这方面早期有洞察力,或者说拥有更好的进化测试手段,从而赢得了领先地位,其他团队还在努力追赶。但有趣的是,我们现在录制这段话时,等它发布时,这个局面可能又发生了变化。

GitHub CEO详谈微软与OpenAI合作、Copilot盈利现状及AI未来智能展望

主持人:欢迎回来,休息前我和Thomas聊到了GitHub的竞争情况。这给了我一个很好的机会去问问微软和OpenAI之间的进展。我们已经几乎谈到了所有主要竞争者。微软目前正和OpenAI商讨双方未来企业关系的新篇章,因为OpenAI正从非营利转为营利机构,而微软显然是重要的大股东,目前拥有IP的独家访问权。作为GitHub的CEO,我很好奇你希望OpenAI和微软的关系未来如何发展?从你的角度来看,这段关系中最重要的是什么?你希望看到什么?

Thomas Dohmke:对于GitHub和所有开发者来说,这段关系始终需要保持健康。双方的合作方式必须是互惠互利、相互支持的。

最初的Copilot正是OpenAI和微软合作的产物。OpenAI开发了GPT-3和Codex模型,而微软不仅拥有超大规模的基础设施,还有多年在AI扩展和运算方面的经验。想想当初的Copilot,那真是个杰作,因为每次敲击键盘时,都能即时调用大型语言模型进行推理,这在当时和那样的规模下是前所未有的——数百万开发者在极短时间内使用它。正是GitHub、微软和OpenAI之间的这种创新合作,创造了如今这个拥有众多竞争者的市场,未来还会有更多新竞争者加入。双方未来的合作将继续催生新的创新,通过新模型和更高效的模型运行方式实现。关于AI的能耗、成本和利润率,已经有很多讨论。对于GitHub而言,我们始终把开发者放在第一位——这就是我们的核心。GitHub一直强调人对人之间的协作,而现在我们正迈向人与Agent的协作,甚至更可能是Agent与Agent之间的协作。这三层协作模式将逐步叠加起来。

OpenAI现在拥有以ChatGPT为代表的最大AI平台。与他们合作,确保开发者在ChatGPT中生成的内容,尤其是基于OpenAI Codex的内容,能够符合相同的安全合规标准——也就是企业级的控制体系,这对开发者采纳这些工具并将其整合到工作流程中至关重要。AI领域最终的竞争将是在平台层展开的。因为如果所有的Agent都异常强大,那么真正重要的是你如何把它们整合进你的其他业务流程。对我们来说,这显然就是开发者生命周期管理。

主持人:讲得很有道理!那我们就以一些关于GitHub和微软的具体问题来结束吧。距离你上次公布年度收入运行率已经过去一年了,我记得当时数字是20亿美元。为什么没有更新?现在的数字是多少?

Thomas Dohmke:投资者关系团队决定了哪些信息可以公开,哪些不公开。所以像往常一样,我只能告诉你财报里写的内容,这次他们决定不公布具体数字。

主持人:好的,我猜数字应该比那个高,我猜应该超过20亿美元。

Thomas Dohmke: 我们还有一些其他令人印象深刻的数据,但我们非常满意第四季度的业绩,真是太棒了。

主持人:Nilay去年曾提过这个问题,我预计你的回答可能差不多。不过,我们有一个关键问题:Copilot对GitHub是否盈利?这一点重要吗?或者说,这是否在决策考量之中?毕竟你们在微软内部,某种程度上是以一个相对独立的组织来管理自己的损益表,那么目前它更像是在创造利润,还是作为争夺市场份额的成本中心存在?

Thomas Dohmke:你说得对,GitHub有自己的盈亏表(P&L),我们是根据那个目标来衡量的。一般来说,从微软整体业务看,各个业务单元肯定希望赚钱,只是时间尺度不同。很多投入很大。更重要的问题是,它能否在客户合同的生命周期内(即LTV)盈利?对此我很有信心,微软领导层会对GitHub的业务感到满意。

我们2018年以75亿美元收购了GitHub,那时GitHub上一次公开的年收入是2亿美元。而你刚才提到去年是20亿美元,七年间收入翻了10倍,可以合理推测这个数字还在增长。你提到Cursor的业务数字,我们对这些数据很公开,我们相信Copilot规模比Cursor还大。你可以根据这些信息去推测我们的数字。所以我们对这笔收购感到非常满意,我个人认为这是微软有史以来最重要的三笔收购之一,Satya Nadella和Amy Hood应该也会同意这个看法。

对此我们感到非常满意。我们以可持续的方式发展了这个平台,没有忽视开源。可以说,我们没搞砸GitHub,GitHub依然是GitHub,依然是开发者生态中最受欢迎的品牌,几乎所有企业都会用,虽然不是每个企业所有开发者都会用,但大多数企业至少部分开发者使用。而且在AI时代,GitHub也实现了自我革新。正如我们用Git来构建GitHub一样,我们用大型语言模型和OpenAI的GPT-3共同打造了史上第一个Copilot,领导了这个市场。

主持人:这回答得不错,我需要好好消化下。那么,Copilot有没有一个明确的盈利目标?比如市场达到某个规模,或者和微软其他产品打包销售,是什么让你们觉得这件事值得投入?

Thomas Dohmke:我们有类似摩尔定律的规律,也许现在应该叫Jensen定律了,就是GPU变得越来越快、越来越便宜。你提到了很多创业公司都在试图发明更高效的变压器处理器。我相信规模的力量,你也可以回顾15年前问Jeff Bezos同样的问题,看看今天超大规模云服务商的盈利情况。

所以我们会有耐心,会努力提升效率。缓存技术已经在Agent里起了巨大作用。商业模式也会不断演进。我们的开发者会因AI变得更高效,不仅仅是优化利润率,而是优化我们内部的软件开发流程。我坚信那些还在怀疑AI作用的公司,最终会落后于创新。如果你不使用AI,就会有巨大的FOMO(错失恐惧症),因为你行业里其他竞争者已经在用AI了,他们的开发者也在用。

使用AI的开发者生产效率能提升10%到20%。虽然有人会问为什么不是30%,但20%已经是巨大的提升了。考虑到软件开发者的成本,以及培训、项目切换所需时间,这种效率提升是非常可观的。

不仅仅是开发者,AI还能提高客户服务、销售、潜在客户发掘等各环节的效率。那些不拥抱AI的公司,无论盈利与否,最终都会在市场竞争中落败。

主持人: 这让我想起你们微软内部一位同事最近写的一份备忘录,指示管理层根据员工使用内部AI工具的情况来评估绩效,并且明确表示这“已经不再是可选项”,而是每个岗位每个层级的核心内容。我想你能理解大家对此转变的焦虑感——有些人在职场上已经走得比较远,感觉自己习惯了原来的工作方式;还有刚入职不久的年轻人,面对各种变化感到不知所措。大家都感到很大压力。如果你是微软的一名中级工程师,可能会想:在这场变革中,我会不会被落下?公司能不能真的准确地评估这点?作为GitHub的CEO,微软管理层真的有一个可衡量的、真实反映AI带来生产力提升的内部评估体系吗?员工们能不能真正知道他们的表现是怎么被衡量的?

Thomas Dohmke:那份备忘录其实更微妙一些。它讲的是我们称之为“Connect”的过程,就是员工和经理之间的对话。GitHub也有类似的评审流程,员工会总结过去一年的成就,反思哪里可以做得更好以提升影响力,以及他们下一年的计划和执行路径。这就是一个框架。到了2025年,完全合理让大家反思自己对AI的使用情况,比如你用没用GitHub Copilot,微软的Copilot,Teams的Copilot去总结会议?如果没有,为什么?然后经理会给出反馈,这个过程对经理来说也是一种学习,有时你会发现员工在AI使用上领先你,我自己就有过这种经历,“让我看看你是怎么做的”,才意识到某些功能确实很有效。

这个流程是微软文化的核心。我们谈的所谓“mindset”(心态)其实就是接受自己可以不断进步,知道自己不是生来就完美的,而是有能力不断自我提升。如果你把这份备忘录放在这样的语境下看,它其实和微软的哲学完全一致。

另外专门说说GitHub,公司里没有一个员工可以不使用GitHub。无论你是什么岗位——不只是开发人员和产品经理,HR、财务、法务、销售等所有职能都在用GitHub。我绝不会允许有人说“不,我不想用GitHub”。这是我们的企业文化。同理,我们也希望每个人都能用上Copilot和AI工具。这并不意味着我们会看你今天写了多少代码、提交了多少pull request或者执行了多少Git命令,因为这些指标很容易被“刷”数据。但这反映了一种心态:你在用我们的工具来构建我们的工具,这跟我们的文化是相符的。

主持人:这是个很好的回答,我想用它来结束这个话题。这是个很重的议题,你可以往任何方向去谈。关于AGI(通用人工智能)、超级智能,以及我们怎么到达那一步,有个观点我听过,Zuckerberg也提过,别人也说过,就是AI编程是通往那里的路径,因为它让自我监督的AI去构建和维护其他AI。而最终,赢得AI编程赛道的公司,很可能会率先实现超级智能——不管你怎么定义“超级智能”,如果你有定义的话,我很想听听。你同意这个观点吗?如果不同意呢?还有,如果你有对超级智能的定义,请跟我们分享,Thomas。

Thomas Dohmke:我自己没有对超级智能的定义,因为这些定义其实没那么重要,除非是合同里规定的,或者就是个很好的营销工具。你可以上台说“我们是第一个拥有超级智能的公司”,然后下周别人又会说“不,我们才是第一个真正有超级智能的”。

这些词汇很模糊,定义不断变化。所谓AGI或ASI(人工超级智能)那个决定性的时刻,是AI能够自我提升,自己让自己变得更好。也就是说,模型可以从GPT-4直接跳到GPT-5,不再需要人类干预。当AI突然像个小孩子一样,从会笑一个笑话进步到会讲笑话的阶段,我们才能真正说AGI出现了。那一刻就是AI可以自我改进、持续进步的时刻。那才是我们作为人类真正认可的“智能”。不是说你追求某个目标,就说明你是最聪明的,只是说明你能在问题和答案之间建立良好对应关系,但能不断自我进化和提升,才是真正的智能。这才是我们应该用的定义。

主持人:当它表现得像个孩子的时候,我很喜欢这个说法,之前还没听过。Thomas,非常感谢你抽出时间接受采访。

原音频:GitHub CEO Thomas Dohmke on Copilot, vibe coding, and Al's next chapter https://www.theverge.com/decoder-podcast-with-nilay-patel/720075/github-ceo-thomas-dohmke-ai-coding-copilot-openai-interview

编译:Chenkai Gao,关注大模型与AI Agent等前沿技术,欢迎交流



欢迎扫码加群参与讨论
图片
---------END--------

我们相信认知能够跨越阶层,
致力于为年轻人提供高质量的科技和财经内容。
投稿邮箱:zfinance2023@126.com

稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。

图片
🚀 我们正在招募新一期的实习生
图片

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/185671