Claude想让模型更有生产力，而不像ChatGPT那样万能但平庸

撰文：陆彦君

编辑：王杰夫

Key Points

Anthropic推出最新的大模型Claude 3，具有分析图像的多模态能力，性能比肩GPT-4；

Claude 3不仅拥有20万上下文窗口，而且保持超强记忆力，这些都是GPT-4不具备的；

Claude 3包含3个系列模型，能力由强到弱分别是Opus、Sonnet、Haiku，其中Sonnet可以在官网上免费体验；

这3个模型恰好是3个PMF，是平衡了智能水平（生产力）和响应速度（交互体验）的结果；

Anthropic一年之内5笔融资合计73亿美元，其中最大金主是亚马逊；

目前客户已经可以通过Amazon Bedrock访问Claude 3。

3月4日，OpenAI的最强竞争对手Anthropic终于推出最新的大模型Claude 3，它发布Claude 2还是在去年7月份。Claude 3包含3个系列模型，能力由强到弱分别是Opus、Sonnet、Haiku。

能力最强的Opus在本科水平专家知识（MMLU）、研究生水平专家推理（GPQA）、基础数学（GSM8K）等多项基准测试中得分均超越GPT-4，研发团队表示其理解力和流畅度已接近人类水平。

Anthropic宣布：「在推理、数学、编码、多语言理解和视觉方面，Claude 3树立了新的行业基准」。

Claude 3具体表现如何？

首次具有视觉功能：这是Anthropic首次推出多模态的大模型。Claude 3系列模型可以读取并处理照片、图表、图形等各种视觉图。例如，在Anthropic的企业客户中，部分客户的数据资料里有50%的内容是PDF、流程图、演示文稿或扫描件，现在这些资料可以用Claude 3轻松转文字。不过需要注意的是，Claude 3目前还无法像ChatGPT那样生成图像，公司也没有透露是否存在图像模型的研发计划。
拒绝率下降：Anthropic是最看重AI安全的头部公司，之前的Claude模型过分谨慎，常常会拒绝回答明明无害的问题。Claude 3对问题语境的理解更细致，能识别真正的有害问题，用户体验进一步提升。
提高准确性：为评估模型的准确性，Anthropic将答案分成正确答案、错误答案（或幻觉）和承认不确定性，结果显示，面对有难度的问题，模型会表示不知道答案，而不是提供不正确的信息。与Claude 2.1相比，Opus在开放式问题上的准确性提高了一倍，同时也减少了错误答案，可以避免用户被误导。
20万上下文窗口，保持超强记忆力：Claude 3延续了前代模型的20万token超长上下文窗口，同时还支持超过100万token的输入，可满足用户处理超长文本的需求。为了有效处理长文本，Claude 3还拥有强大的记忆力。「大海捞针」（NIAH）测试被用来评估衡量模型从大量数据中准确回忆信息的能力，而Opus实现了「接近完美」的回忆，准确率超过99%。

Claude 3系列模型的特点

或许Anthropic是参考了Google的大模型产品线，后者将Gemini按照参数规模由大到小分成了Ultra、Pro、Nano 3个模型，此次的Claude 3同样包含3个系列模型，由强到弱分别是Opus、Sonnet、Haiku。

具体来看：

Opus在拉丁语中的意思是「作品集」，其响应速度与Claude 2和Claude 2.1相近，但拥有更高的智能水平。Opus是Claude 3中最智能的大模型，可以处理超长文本、高阶数学等复杂任务，未来将提供给Claude Pro订阅者使用。
Claude 3 Opus作为经济分析师。视频来源：亚马逊云科技。
Sonnet的意思是「十四行诗」，其响应速度比Claude 2和Claude 2.1快两倍，智能水平也略高，它擅长执行需要快速响应、高吞吐量的任务，例如知识检索或销售自动化。Sonnet是性能和速度的最佳组合，目前可在claude.ai网站上免费体验。
视频来源：亚马逊云科技。Claude 3 Sonnet作为语言学习伙伴。
Haiku指日语的「俳句」，它是市场上速度最快、最具成本效益的型号。例如，将arXiv上数据密集、包含图表与图形的研究论文（大约1万token）输入给Haiku，它在不到3秒的时间里即可读取。Haiku可执行轻量级的操作，即将开放使用。
视频来源：亚马逊云科技。Claude 3 Haiku将海量文本转换成结构化数据。

可以看出来，Anthropic在Google的三分法的基础上更进一步，与Google单纯按照「参数规模」这个单一指标来划分不同，Anthropic还引入了「响应速度」这个维度。换句话说，Claude 3的3个模型恰好是3个「产品-市场最佳契合点」（Product-Market Fit，PMF），是平衡了智能水平（生产力）和响应速度（体验交互）的结果。

这其实反映出技术公司在产品策略上的不同，Google的思路和OpenAI相似，专注于提升模型的能力，产品化通过API交给下游开发者来完善。而Anthropic在打磨产品体验上下了更多功夫，直接向用户提供了「拎包入住」的方案。

Anthropic的融资历程

Anthropic的创始团队也是GPT系列的早期开发者，因价值观差异，创始人决定从OpenAI离职，转而建立一家「以人类利益为中心」的人工智能公司。Anthropic被视为最有可能挑战OpenAI的公司，其融资历程如下：

2021年5月：获得1.24亿美元融资，Skype联合创始人Jaan Tallinn领投（A轮）；
2022年4月：获得5.8亿美元融资，FTX首席执行官Sam Bankman-Fried领投（B轮）；
2023年2月：获得Google投资3亿美元，Google持股10%；
2023年5月：获得4.5亿美元融资，Spark Capital领投（C轮）；
2023年8月：获得韩国最大电信公司SK 1亿美元投资；随后亚马逊向其投入了40亿美元，Google又投入了20亿美元；
2024年2月：获得风险投资公司Menlo Ventures 7.5亿美元的投资。

这家公司一年之内的5笔融资合计73亿美元，不仅融资速度和规模引人注目，不寻常的还有其融资结构。2023年的单笔最大融资是来自亚马逊的40亿美元，在交易中，Anthropic同意使用亚马逊的芯片和云计算服务，这意味着筹集的部分资金将重新回到投资者手中，因为云计算交易将提高亚马逊的利润。

两位知情人士表示，Anthropic与亚马逊的交易结构为可转换票据，这意味着在未来某个规定的时间点，这些债务将可能变成股权。在Claude 3发布的当天，亚马逊云科技宣布，该系列模型将基于Amazon Bedrock提供服务，客户可以通过Amazon Bedrock访问Claude 3。

OpenAI的融资方式与Anthropic类似。2019年，OpenAI从微软获得10亿美元，其中大部分资金通过微软的Azure云服务购买了算力。此后微软又向该公司注资100亿美元，OpenAI则将大部分资金花在了微软的云服务上。

技术巨头对AI初创企业的投资最近引起了监管机构的关注。上个月，美国联邦贸易委员会表示，已针对亚马逊和Google对Anthropic的投资是否存在潜在的反垄断行为展开调查。

参考链接

https://www.anthropic.com/news/claude-3-family

-END-

AI独角兽｜②Anthropic：最可能挑战OpenAI的公司

大佬说｜黄仁勋：一切皆计算

智能晚报｜台积电开始第3代交班；马斯克起诉OpenAI，要求对GPT-4是否AGI做司法鉴定……