【ChatGPT的音频和图像处理能力将在两周内向 Plus 和 -20230926063421

2023-09-26 06:34
本条微博链接

【ChatGPT的音频和图像处理能力将在两周内向 Plus 和 Enterprise 用户提供】
- “我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面，允许您进行语音对话或向 ChatGPT 展示您正在谈论的内容。”
- 语音和图像为ChatGPT在生活中的应用提供了更多方式。用户可以针对旅游景点进行语音交谈，对冰箱和食品橱柜拍照并获得菜谱建议等。
- 语音功能面向Plus和Enterprise用户推出，支持iOS和Android，用户可以选择5种不同的语音。语音能力由新式文本转语音模型提供，能从少量语音样本生成人声。
- 图像功能允许用户向ChatGPT展示一张或多张图片。图像理解由多模态GPT-3.5和GPT-4驱动。
- OpenAI计划逐步推出这些新功能。先面向Plus和Enterprise用户，之后再向其他用户群体开放，以便在广泛部署前改进风险缓解措施。
- 语音功能带来身份欺诈等新风险。图像功能可能导致对人的错误判断。OpenAI采取各种技术措施降低这些风险。
- OpenAI提醒用户ChatGPT有局限性，在特定高风险场景下不应完全依赖其判断。
《ChatGPT can now see, hear, and speak》

网页链接 #机器学习#