随着这个领域(还有资金)在过去10年的爆炸式增长,我觉得人们很容易忽略PyTorch究竟产生了多么深远的影响。或许追踪这个领域资金流向最直观的指标就是英伟达的股价了,它主要受服务器GPU销售增长的推动。我认为可以合理推测,至少75%的这些GPU都在运行某种形式的PyTorch代码。这简直令人难以置信。英伟达增长了约3万亿美元的市值,而PyTorch在这一成就中功不可没。
不仅如此,在整个机器学习社区中,PyTorch依然是大家的「通用语言」。Papers With Code追踪的研究论文中有59%使用PyTorch(另有29%不使用任何机器学习框架),Huggingface平台上绝大多数模型(超过90%?)都构建在PyTorch之上,最受欢迎的推理服务器如vllm和sglang也都是基于PyTorch开发的。即使在顶尖AI实验室中,几乎所有使用GPU的公司都在用PyTorch。OpenAI、Mistral、Deepseek和Meta主要使用PyTorch(和GPU)。Anthropic也主要在GPU上使用PyTorch,而xAI(虽然在GPU训练上使用Jax)也通过sglang使用PyTorch进行推理!在高中时期,我最担心的事情之一就是自己会花上10年时间投入某个项目,最后却发现我浪费了大好时光去完善一个无人问津的东西。而在PyTorch工作的最大幸运之一,就是我确信自己绝对没有做这样的无用功。