Py学习  »  chatgpt

中国AI刷屏外媒,DeepSeek下载热度仅次于ChatGPT!

财经网 • 8 月前 • 286 次点击  

来源 | 九派新闻


近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。


截至发稿,DeepSeek在美区苹果App Store的免费排行榜中飙升至第四,排行第一仍是ChatGPT。



DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。


DeepSeek-R1 API价格。图源:澎湃新闻


去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”



不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。


据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。


这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”


图源:证券时报


1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。



这位Meta员工写道:


“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。


工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。


管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?


DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”



外媒集体刷屏:给硅谷敲响警钟

最近四天,国外媒体纷纷聚焦DeepSeek,并一致认为中国大模型的新进展为硅谷敲响了警钟。


1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。开源的先进AI可能挑战那些试图通过出售技术赚取巨额利润的公司。



1月24日,美国媒体CNBC推出了长达40分钟的节目,邀请了Perplexity CEO Aravind Srinivas来分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。


英国《金融时报》1月25日报道称,中国小型AI初创公司DeepSeek震惊硅谷。报道聚焦资源更丰富的美国AI公司能否捍卫自己的技术优势。



用户访问量激增

DeepSeek出现短时闪崩


26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。


综合自每日经济新闻、证券时报、澎湃新闻、界面新闻等。


往期推荐

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178405