社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

Claude想让模型更有生产力,而不像ChatGPT那样万能但平庸

新皮层NewNewThing • 1 年前 • 232 次点击  

撰文:陆彦君

编辑:王杰夫

Key Points


Anthropic推出最新的大模型Claude 3,具有分析图像的多模态能力,性能比肩GPT-4;


Claude 3不仅拥有20万上下文窗口,而且保持超强记忆力,这些都是GPT-4不具备的;


Claude 3包含3个系列模型,能力由强到弱分别是Opus、Sonnet、Haiku,其中Sonnet可以在官网上免费体验;


这3个模型恰好是3个PMF,是平衡了智能水平(生产力)和响应速度(交互体验)的结果;


Anthropic一年之内5笔融资合计73亿美元,其中最大金主是亚马逊;


目前客户已经可以通过Amazon Bedrock访问Claude 3。

3月4日,OpenAI的最强竞争对手Anthropic终于推出最新的大模型Claude 3,它发布Claude 2还是在去年7月份。Claude 3包含3个系列模型,能力由强到弱分别是Opus、Sonnet、Haiku。

能力最强的Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多项基准测试中得分均超越GPT-4,研发团队表示其理解力和流畅度已接近人类水平。

Anthropic宣布:「在推理、数学、编码、多语言理解和视觉方面,Claude 3树立了新的行业基准」。

Claude 3具体表现如何?

  • 首次具有视觉功能:这是Anthropic首次推出多模态的大模型。Claude 3系列模型可以读取并处理照片、图表、图形等各种视觉图。例如,在Anthropic的企业客户中,部分客户的数据资料里有50%的内容是PDF、流程图、演示文稿或扫描件,现在这些资料可以用Claude 3轻松转文字。不过需要注意的是,Claude 3目前还无法像ChatGPT那样生成图像,公司也没有透露是否存在图像模型的研发计划。

  • 拒绝率下降:Anthropic是最看重AI安全的头部公司,之前的Claude模型过分谨慎,常常会拒绝回答明明无害的问题。Claude 3对问题语境的理解更细致,能识别真正的有害问题,用户体验进一步提升。

  • 提高准确性:为评估模型的准确性,Anthropic将答案分成正确答案、错误答案(或幻觉)和承认不确定性,结果显示,面对有难度的问题,模型会表示不知道答案,而不是提供不正确的信息。与Claude 2.1相比,Opus在开放式问题上的准确性提高了一倍,同时也减少了错误答案,可以避免用户被误导。

  • 20万上下文窗口,保持超强记忆力:Claude 3延续了前代模型的20万token超长上下文窗口,同时还支持超过100万token的输入,可满足用户处理超长文本的需求。为了有效处理长文本,Claude 3还拥有强大的记忆力。「大海捞针」(NIAH)测试被用来评估衡量模型从大量数据中准确回忆信息的能力,而Opus实现了「接近完美」的回忆,准确率超过99%。

Claude 3系列模型的特点

或许Anthropic是参考了Google的大模型产品线,后者将Gemini按照参数规模由大到小分成了Ultra、Pro、Nano 3个模型,此次的Claude 3同样包含3个系列模型,由强到弱分别是Opus、Sonnet、Haiku。

具体来看:

  • Opus在拉丁语中的意思是「作品集」,其响应速度与Claude 2和Claude 2.1相近,但拥有更高的智能水平。Opus是Claude 3中最智能的大模型,可以处理超长文本、高阶数学等复杂任务,未来将提供给Claude Pro订阅者使用。

    Claude 3 Opus作为经济分析师。视频来源:亚马逊云科技。
  • Sonnet的意思是「十四行诗」,其响应速度比Claude 2和Claude 2.1快两倍,智能水平也略高,它擅长执行需要快速响应、高吞吐量的任务,例如知识检索或销售自动化。Sonnet是性能和速度的最佳组合,目前可在claude.ai网站上免费体验。

    视频来源:亚马逊云科技。Claude 3 Sonnet作为语言学习伙伴。
  • Haiku指日语的「俳句」,它是市场上速度最快、最具成本效益的型号。例如,将arXiv上数据密集、包含图表与图形的研究论文(大约1万token)输入给Haiku,它在不到3秒的时间里即可读取。Haiku可执行轻量级的操作,即将开放使用。

    视频来源:亚马逊云科技。Claude 3 Haiku将海量文本转换成结构化数据。

可以看出来,Anthropic在Google的三分法的基础上更进一步,与Google单纯按照「参数规模」这个单一指标来划分不同,Anthropic还引入了「响应速度」这个维度。换句话说,Claude 3的3个模型恰好是3个「产品-市场最佳契合点」(Product-Market Fit,PMF),是平衡了智能水平(生产力)和响应速度(体验交互)的结果。

这其实反映出技术公司在产品策略上的不同,Google的思路和OpenAI相似,专注于提升模型的能力,产品化通过API交给下游开发者来完善。而Anthropic在打磨产品体验上下了更多功夫,直接向用户提供了「拎包入住」的方案。

Anthropic的融资历程

Anthropic的创始团队也是GPT系列的早期开发者,因价值观差异,创始人决定从OpenAI离职,转而建立一家「以人类利益为中心」的人工智能公司。Anthropic被视为最有可能挑战OpenAI的公司,其融资历程如下:

  • 2021年5月:获得1.24亿美元融资,Skype联合创始人Jaan Tallinn领投(A轮);

  • 2022年4月:获得5.8亿美元融资,FTX首席执行官Sam Bankman-Fried领投(B轮);

  • 2023年2月:获得Google投资3亿美元,Google持股10%;

  • 2023年5月:获得4.5亿美元融资,Spark Capital领投(C轮);

  • 2023年8月:获得韩国最大电信公司SK 1亿美元投资;随后亚马逊向其投入了40亿美元Google又投入了20亿美元

  • 2024年2月:获得风险投资公司Menlo Ventures 7.5亿美元的投资

这家公司一年之内的5笔融资合计73亿美元,不仅融资速度和规模引人注目,不寻常的还有其融资结构。2023年的单笔最大融资是来自亚马逊的40亿美元,在交易中,Anthropic同意使用亚马逊的芯片和云计算服务,这意味着筹集的部分资金将重新回到投资者手中,因为云计算交易将提高亚马逊的利润。

两位知情人士表示,Anthropic与亚马逊的交易结构为可转换票据,这意味着在未来某个规定的时间点,这些债务将可能变成股权。在Claude 3发布的当天,亚马逊云科技宣布,该系列模型将基于Amazon Bedrock提供服务,客户可以通过Amazon Bedrock访问Claude 3。

OpenAI的融资方式与Anthropic类似。2019年,OpenAI从微软获得10亿美元,其中大部分资金通过微软的Azure云服务购买了算力。此后微软又向该公司注资100亿美元,OpenAI则将大部分资金花在了微软的云服务上。

技术巨头对AI初创企业的投资最近引起了监管机构的关注。上个月,美国联邦贸易委员会表示,已针对亚马逊和Google对Anthropic的投资是否存在潜在的反垄断行为展开调查。


参考链接

https://www.anthropic.com/news/claude-3-family

-END-

AI独角兽|②Anthropic:最可能挑战OpenAI的公司
大佬说|黄仁勋:一切皆计算

智能晚报|台积电开始第3代交班;马斯克起诉OpenAI,要求对GPT-4是否AGI做司法鉴定……

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/167600
 
232 次点击