Karpathy教你值回ChatGPT 200刀「票价」，初创工程师揭秘ChatGPT最核心能力

新智元报道

编辑：定慧

【新智元导读】AI大神Karpathy亲授ChatGPT模型使用指南：o3适合处理复杂任务，4o胜任日常提问，代码写作用GPT-4.1。Eric Hayes揭秘了ChatGPT背后核心记忆系统，正是这些让ChatGPT越来越懂你。

ChatGPT你肯定已经用过，也用的很「爽」，但你的使用方法大概率是不对的！

别急，这是OpenAI初创大神Andrej Karpathy说的，「热衷于」科普AI的他再度出手。

这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型！

众所周知，OpenAI给模型起了一堆名字：GPT-4o、o3、o4-mini、o4-mini-high、o1 pro mode...

简直看的人眼花缭乱，根本不知道这些模型之间的区别。

甚至因为无法选择正确的模型，日常使用都无法值回每个月20刀Plus的「票价」，更别说200刀的Pro会员了。

很多人并不知道，ChatGPT的这些模型之间差别很大，比如：

o3是处理重要或困难问题时最好的选择。

它是一个推理能力非常强的模型，比4o更强大。如果你是专业使用ChatGPT，而没有用o3，那你大概率会吃亏。

4o和o4是完全不同的东西。

大神Karpathy也不得不调侃，OpenAI这命名是真的混乱。

4o是应对日常简单到中等难度问题的「日常主力」好选择。而o4目前只有mini版本，表现不如o3。

这些模型别用！

Karpathy还强调了，像o4-mini、o4-mini-high和o1-pro等模型就别用了，一点好处没有！

Karpathy说他甚至无法理解OpenAI为什么现在就把o4-mini放出来了。

AI大神教你玩转ChatGPT

Karpathy根据他的使用经验和ChatGPT不同模型之间的区别，给出如下这份「使用指南」。

任何简单的问题

比如「哪些食物富含膳食纤维？」 => 用4o（大约占Karpathy使用量的40%）

任何困难或重要的问题，只要我愿意多等一会儿

比如「帮我理解这个税务问题……」） => 用o3（也是大约占Karpathy使用量40%）

随意写代码或者边想边改代码的时候

比如「把这段代码改成……」 => 用GPT-4.1（大约10%）

想深入理解一个主题——

希望GPT花10分钟，查很多链接并总结一整套信息。

比如「帮我了解Luminar的兴衰历程」 => 用Deep Research（大约占10%）

注意：Deep Research不是模型选择器里的一个版本（！！！），它是在Tools工具里打开的一个功能。

从底层来说它是基于o3的，但Karpathy认为它和直接用o3还是不完全一样（虽然Karpathy也不太确定）。

如果你掌握Karpathy给出的模型正确用法，你会发现ChatGPT真的越来越好用。

而且用的越多，你就会发现ChatGPT越来越懂你，就好像他化身你的「贾维斯」，记住了你平时的一切。

在这背后其实是因为ChatGPT拥有超强的记忆力，而这也是为何ChatGPT命名如此「混乱」的前提下，大家仍然爱用，并且是周活最高的AI工具，没有之一。

揭秘ChatGPT「超强记忆力」

ChatGPT变得越来越懂你，似乎能记住你过去的偏好，甚至跨越多个对话还能联系上下文。

这背后可不只是简单的上下文窗口，而是一套复杂且精妙的记忆系统在运作。

近日，一位来自初创公司的工程师Eric Hayes通过一篇博客，揭秘了ChatGPT背后复杂的记忆系统。

今天，就跟随Eric Hayes来深入解析这套让ChatGPT脱颖而出的「记忆魔法」！

ChatGPT的记忆系统使其体验远远优于其他大语言模型（LLMs）。

这主要得益于它将记忆系统分为两大类：「保存记忆（Saved Memory）」和「聊天历史（Chat History）」。

保存记忆（Saved Memory)

想象一下，你告诉ChatGPT你的喜好，它就能牢牢记住。这就是「保存记忆」的功能。

这是一个简单、用户可控的系统。你可以通过明确的指令，例如「记住我是一名软件工程师」或「当我推荐食谱时，请记住我是素食主义者」，来更新这些记忆。

这些记忆会以事实的形式被注入到系统提示中，影响后续的对话。例如，你可以让ChatGPT记住你喜欢简洁的回答，或者你是一名Rust编程专家，它就会根据这些偏好来调整回应。

ChatGPT提供了一个简单的用户界面，让你查看和删除这些记忆。你也可以通过指令要求ChatGPT删除已保存的记忆。

这个功能还可以智能识别。它会进行最小程度的重复和矛盾检查。

例如，如果你告诉它「我是一名软件工程师」，它可能会保存；但如果你说「我不是软件工程师」，它会拒绝并要求你澄清。

不过，对于高度相关但不同的信息（如「软件工程师」、「前端工程师」），它是允许并存的。

这个系统通过一个名为「bio tool」的工具来实现，Eric Hayes逆向了ChatGPT的记忆系统，发现这个名为bio的方法。

聊天历史（Chat History)

「聊天历史」系统比「保存记忆」复杂得多，它可能才是提升ChatGPT响应能力的关键。它又可以细分为三个子系统：

1. 当前会话历史（Current Session History）

这就像是机器人短暂的「短期记忆」。它记录了用户在当前会话中最近的消息。

这个记录很小，只包含最近一天的消息，通常少于10条。

它可以直接引用用户在当前会话中发送的消息。

2. 对话历史（Conversation History）

这个系统负责记住你与ChatGPT过去对话中的相关上下文。

并且可以进行跨对话记忆，ChatGPT能够引用你在其他对话中发送的直接消息。

Eric Hayes在测试中发现，ChatGPT可以准确引用两周内的消息。

超过两周后，它通常只能提供你消息的摘要，而不是直接引用。

消息检索是通过「对话摘要」和「消息内容」进行索引的。

这意味着即使你记不清具体词句，只要描述内容或对话主题，ChatGPT也能找到相关信息。

对于更久远的对话，系统可能会存储推断出来的信息，提供更小、更不具体的上下文。

3. 用户洞察（User Insights）

这可能是ChatGPT最强大、最「聪明」的记忆形式！

它是「保存记忆」的更高级、更不透明的版本。

这些洞察是系统通过分析用户在多个对话中的行为和提问自动生成的。它们会包含时间范围和置信度。

用户洞察能够捕获你的专业领域、兴趣偏好、提问风格等深层信息。

例如，它可能会记录你「对Rust编程有丰富的经验和知识」或「偏爱简洁的回答」。

通过这些详细的洞察，ChatGPT能够最小化令人沮丧的交互，并以用户容易理解的方式呈现信息。

Eric Hayes认为用户洞察系统可能是ChatGPT感知智能提升的80%以上的原因！

Eric Hayes还发现这些洞察可能并非实时生成，而是通过批处理（例如每周运行一次的定时任务）来更新。

它通过将用户查询建模为聚类优化问题，从而从大量历史消息中提取出独特的、有用的洞察。

这对用户体验意味着什么？

正是这些复杂的记忆系统，让ChatGPT在使用时感觉如此「好用」！

保存记忆让你直接设定偏好，让ChatGPT为你量身定制回应。

用户洞察则自动化了这一过程，即使你不明确告知，ChatGPT也能根据你的历史行为自动调整其回应，提供更贴切的解释，避免重复提问。

聊天历史系统确保了对话的连贯性，让你在回顾旧话题时，ChatGPT依然能维持对先前互动的共享知识，避免重复、循环或矛盾的交互。

可以说，ChatGPT的记忆系统超越了简单的上下文窗口，通过分层、智能地存储和检索信息，极大地提升了用户体验，让它感觉更像是一个能够学习和成长的智能伙伴。

参考资料：

https://x.com/karpathy/status/1929597620969951434

https://macro.com/app/md/54115a42-3409-4f5b-9120-f144d3ecd23a