
撰文:陆彦君
编辑:王杰夫
Anthropic推出最新的大模型Claude 3,具有分析图像的多模态能力,性能比肩GPT-4;
Claude 3不仅拥有20万上下文窗口,而且保持超强记忆力,这些都是GPT-4不具备的;
Claude 3包含3个系列模型,能力由强到弱分别是Opus、Sonnet、Haiku,其中Sonnet可以在官网上免费体验;
这3个模型恰好是3个PMF,是平衡了智能水平(生产力)和响应速度(交互体验)的结果;
Anthropic一年之内5笔融资合计73亿美元,其中最大金主是亚马逊;
目前客户已经可以通过Amazon Bedrock访问Claude 3。
3月4日,OpenAI的最强竞争对手Anthropic终于推出最新的大模型Claude 3,它发布Claude 2还是在去年7月份。Claude 3包含3个系列模型,能力由强到弱分别是Opus、Sonnet、Haiku。
能力最强的Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多项基准测试中得分均超越GPT-4,研发团队表示其理解力和流畅度已接近人类水平。
Anthropic宣布:「在推理、数学、编码、多语言理解和视觉方面,Claude 3树立了新的行业基准」。
首次具有视觉功能:这是Anthropic首次推出多模态的大模型。Claude 3系列模型可以读取并处理照片、图表、图形等各种视觉图。例如,在Anthropic的企业客户中,部分客户的数据资料里有50%的内容是PDF、流程图、演示文稿或扫描件,现在这些资料可以用Claude 3轻松转文字。不过需要注意的是,Claude 3目前还无法像ChatGPT那样生成图像,公司也没有透露是否存在图像模型的研发计划。
拒绝率下降:Anthropic是最看重AI安全的头部公司,之前的Claude模型过分谨慎,常常会拒绝回答明明无害的问题。Claude 3对问题语境的理解更细致,能识别真正的有害问题,用户体验进一步提升。
提高准确性:为评估模型的准确性,Anthropic将答案分成正确答案、错误答案(或幻觉)和承认不确定性,结果显示,面对有难度的问题,模型会表示不知道答案,而不是提供不正确的信息。与Claude 2.1相比,Opus在开放式问题上的准确性提高了一倍,同时也减少了错误答案,可以避免用户被误导。
20万上下文窗口,保持超强记忆力:Claude 3延续了前代模型的20万token超长上下文窗口,同时还支持超过100万token的输入,可满足用户处理超长文本的需求。为了有效处理长文本,Claude 3还拥有强大的记忆力。「大海捞针」(NIAH)测试被用来评估衡量模型从大量数据中准确回忆信息的能力,而Opus实现了「接近完美」的回忆,准确率超过99%。
或许Anthropic是参考了Google的大模型产品线,后者将Gemini按照参数规模由大到小分成了Ultra、Pro、Nano 3个模型,此次的Claude 3同样包含3个系列模型,由强到弱分别是Opus、Sonnet、Haiku。
具体来看:
Opus在拉丁语中的意思是「作品集」,其响应速度与Claude 2和Claude 2.1相近,但拥有更高的智能水平。Opus是Claude 3中最智能的大模型,可以处理超长文本、高阶数学等复杂任务,未来将提供给Claude Pro订阅者使用。
Claude 3 Opus作为经济分析师。视频来源:亚马逊云科技。
Sonnet的意思是「十四行诗」,其响应速度比Claude 2和Claude 2.1快两倍,智能水平也略高,它擅长执行需要快速响应、高吞吐量的任务,例如知识检索或销售自动化。Sonnet是性能和速度的最佳组合,目前可在claude.ai网站上免费体验。
视频来源:亚马逊云科技。Claude 3 Sonnet作为语言学习伙伴。
Haiku指日语的「俳句」,它是市场上速度最快、最具成本效益的型号。例如,将arXiv上数据密集、包含图表与图形的研究论文(大约1万token)输入给Haiku,它在不到3秒的时间里即可读取。Haiku可执行轻量级的操作,即将开放使用。
视频来源:亚马逊云科技。Claude 3 Haiku将海量文本转换成结构化数据。
可以看出来,Anthropic在Google的三分法的基础上更进一步,与Google单纯按照「参数规模」这个单一指标来划分不同,Anthropic还引入了「响应速度」这个维度。换句话说,Claude 3的3个模型恰好是3个「产品-市场最佳契合点」(Product-Market Fit,PMF),是平衡了智能水平(生产力)和响应速度(体验交互)的结果。
这其实反映出技术公司在产品策略上的不同,Google的思路和OpenAI相似,专注于提升模型的能力,产品化通过API交给下游开发者来完善。而Anthropic在打磨产品体验上下了更多功夫,直接向用户提供了「拎包入住」的方案。
Anthropic的创始团队也是GPT系列的早期开发者,因价值观差异,创始人决定从OpenAI离职,转而建立一家「以人类利益为中心」的人工智能公司。Anthropic被视为最有可能挑战OpenAI的公司,其融资历程如下:
2021年5月:获得1.24亿美元融资,Skype联合创始人Jaan Tallinn领投(A轮);
2022年4月:获得5.8亿美元融资,FTX首席执行官Sam Bankman-Fried领投(B轮);
2023年2月:获得Google投资3亿美元,Google持股10%;
2023年5月:获得4.5亿美元融资,Spark Capital领投(C轮);
2023年8月:获得韩国最大电信公司SK 1亿美元投资;随后亚马逊向其投入了40亿美元,Google又投入了20亿美元;
2024年2月:获得风险投资公司Menlo Ventures 7.5亿美元的投资。
这家公司一年之内的5笔融资合计73亿美元,不仅融资速度和规模引人注目,不寻常的还有其融资结构。2023年的单笔最大融资是来自亚马逊的40亿美元,在交易中,Anthropic同意使用亚马逊的芯片和云计算服务,这意味着筹集的部分资金将重新回到投资者手中,因为云计算交易将提高亚马逊的利润。
两位知情人士表示,Anthropic与亚马逊的交易结构为可转换票据,这意味着在未来某个规定的时间点,这些债务将可能变成股权。在Claude 3发布的当天,亚马逊云科技宣布,该系列模型将基于Amazon Bedrock提供服务,客户可以通过Amazon Bedrock访问Claude 3。
OpenAI的融资方式与Anthropic类似。2019年,OpenAI从微软获得10亿美元,其中大部分资金通过微软的Azure云服务购买了算力。此后微软又向该公司注资100亿美元,OpenAI则将大部分资金花在了微软的云服务上。
技术巨头对AI初创企业的投资最近引起了监管机构的关注。上个月,美国联邦贸易委员会表示,已针对亚马逊和Google对Anthropic的投资是否存在潜在的反垄断行为展开调查。
参考链接
https://www.anthropic.com/news/claude-3-family

智能晚报|台积电开始第3代交班;马斯克起诉OpenAI,要求对GPT-4是否AGI做司法鉴定……