社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

大悬念!奥特曼宣布GPT-4和ChatGPT明日将有重大更新,或与Agent相关

AI工程化 • 4 月前 • 96 次点击  

夕小瑶科技说 原创
作者 | 付奶茶
OpenAI在昨天官宣13日(明日10点)开启线上直播,将会展示全新的ChatGPT demo的演示以及GPT-4的重大更新!

OpenAI首席执行官Sam Altman在X上表示,这些的发布会,公司不会宣布下一代对话式人工智能GPT-5或人工智能驱动的搜索引擎。

但是!虽然没有新的搜索引擎,但是还会有惊喜!

然而!广大网友并不相信!

  1. 路透社的内部消息说,OpenAI周一确实要出招了!

2.这可能是OpenAI的铲除内奸的手段,经常给Jimmy Apples、Flowers泄密的爆料人,已经被OpenAI解雇。

可是到底谁说的是真的呢?周一夕小瑶会蹲守,给大家搬运带来第一手情报,请大家关注!

不止搜索引擎

在众多企业竞相开发模拟人类交流能力的人工智能技术中,OpenAI 正在准备展示其最新技术,这不仅包括文本交流,还扩展到声音识别及物体和图像的辨识。

据了解OpenAI人工智能技术的内部人士透露,ChatGPT 的开发者们已向部分客户展示了这些先进功能,包括比现有产品更强的逻辑推理能力。

这项技术是 OpenAI 首席执行官 Sam Altman 追求的目标之一,即开发出类似于斯派克·琼斯电影《她》中的高度响应式虚拟助手,使其能与苹果的 Siri 等现有语音助手竞争,提供更加实用的功能。OpenAI可能会在本周一或更早前公开预览这款升级后的人工智能,以期在谷歌即将发布的一系列AI产品公告前抢占先机。

据透露,由于这项新技术规模庞大,它无法直接在个人设备上运行,但客户可以在短期内使用基于云的版本来改进OpenAI软件已支持的功能,如自动客服代理。

新软件的音频功能将使这些代理更好地理解呼叫者的语调,甚至识别出讽刺语气。

OpenAI 已经具备音频转录及将文本转换为语音的软件能力,但这些功能目前是通过单独的对话 AI 模型提供的。新模型将整合这些功能,使得新的多模态模型在处理图像和音频方面的理解能力更强,使用起来也更为便捷。

OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音

一位使用过该机器人的人士表示,目前尚不清楚 OpenAI 何时向其付费客户提供这些新功能,但该公司最终计划将这些新功能纳入其聊天机器人 ChatGPT 免费版本的一部分。

这位人士表示,OpenAI 的目标是让支持这些功能的新 AI 模型比目前销售的最先进模型 GPT-4 Turbo 的运行成本更低。这位人士表示,新模型在回答某些类型的问题方面也优于 GPT-4 Turbo。然而,新模型仍然会犯错误(幻觉)。

GPT-5 发布?

去年12月,谷歌展示了他们开发的对话式人工智能Gemini的功能,它能实时响应语音命令并识别视觉图像。然而,谷歌指出,展示中的这些功能需要研究人员通过图像和文本指令来激活模型,而不仅是简单的对话。同时,虽然Gemini新增了音频分析功能,但它无法理解多种传统语音命令,也无法像Siri和Google Assistant等成熟的语音助手那样与用户进行流畅对话。另一方面,Meta Platforms在4月发布的开源Llama 3模型,在对话式AI领域的表现超越了当今大多数模型,获得了业界内外的广泛赞誉。

▲来自 Google 12 月份通过 YouTube 展示 Gemini AI 多模式功能的静态图像

OpenAI即将推出的新模型将是其保持行业领先地位的关键一步!

OpenAI已经被证实确实在正在开发GPT-5,希望它能够在去年推出的GPT-4基础上做出显著改进。但是根据网友的推测,GPT-5有望在今年年底前完成并公开发布。

OpenAI的惯例

OpenAI之前宣布的一些项目未能获得预期的关注。

例如,虽然这家初创公司曾向开发者承诺,他们将在今年第一季度通过构建定制聊天机器人来赚钱,但 OpenAI 尚未推出使之成为可能的具体方法。

另一方面,增强视觉和音频处理功能可能助力OpenAI扩展其对话式AI技术,使之能在全球数百万甚至数十亿台苹果设备上运行。

据彭博社报道,近月来,这家著名的 iPhone 制造商已与 OpenAI 探讨如何在下一代 iPhone 操作系统中整合其 AI 模型。

拜登召集奥特曼和李飞飞等入AI安全委员会,没带马斯克!库克考虑将iPhone AI服务委托给OpenAI

然而,作为 ChatGPT 的生产商,OpenAI 面临激烈的市场竞争。彭博社透露,苹果同时也在与谷歌就类似事宜进行谈判。

此外,OpenAI 的首席执行官 Sam Altman 正在与苹果的前设计主管 Jony Ive 合作,开发一款独立的 AI 消费设备。这款设备可能会从 Emerson Collective 和 Thrive Capital 等投资者那里筹集高达 10 亿美元的资金。通过这样的合作,Altman 旨在与其他大型科技公司和初创企业竞争,这些企业都在积极推出以 AI 驱动的设备和可穿戴技术,以吸引消费者的兴趣和投资。

然而,目前最先进的人工智能模型因规模庞大,通常需要在云端运行,并依赖于互联网连接。这种集成了视觉和音频功能的复杂会话 AI,可能还需要数月甚至数年的时间才能被优化至足够小的尺寸,以便在设备上独立运行。

分级定价

OpenAI 计划今年推出一种新的定价模型,如果客户提前支付并预订Token,可以享受高达50%的折扣。

目前,OpenAI主要采用按需定价策略,根据生成的Token数量收费,费用从几美分到120美元不等,并为大客户提供批量折扣。

这种提前付款的折扣方式在云计算行业很常见,像Microsoft Azure、Google Cloud和Amazon Web Services等都有类似的优惠,让客户通过预订服务器容量来降低成本。

OpenAI希望通过这种更灵活的定价方式,能更有效地与其他模型开发商和那些帮助开发者以更低成本运行开源模型的公司(被称为AI服务器经销商或推理提供商)竞争。这些公司因为非常注重成本效率,有时会以极低的价格,甚至低于成本价提供服务。

此外,OpenAI在4月份推出了一种名为Batch API的新接口,通过这个接口,如果开发者批量上传模型查询并愿意等待最长24小时的回应时间,可以享受更低的价格。而像Together AI和Anyscale这样的AI服务器经销商也表示,使用他们的软件运行开源模型的成本,比使用OpenAI的模型要低很多。

最后,网络上掀起了对具体发布什么展开了大猜想。

大部分人认为可能这与agent有关,难道也是agent workflow ?让我们拭目以待!

后台回复“进群”入群讨论。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/169977
 
96 次点击