ChatGPT现在能用GPT-4o直接生成超逼真图片了AI画图再-20250326061525

2025-03-26 06:15
本条微博链接

ChatGPT现在能用GPT-4o直接生成超逼真图片了
AI画图再进化：文字不再乱码，细节更真实，商用价值大增

你能想象，动动嘴就能让ChatGPT生成复杂的科学实验图、清晰的菜单，甚至是生动的漫画吗？这件事如今变得更容易了。

OpenAI正式宣布将全新升级的图像生成功能整合进ChatGPT。这次升级的核心是GPT-4o模型，用户无需额外工具即可在ChatGPT内直接生成高质量的图片。

这次升级带来了哪些值得关注的新特性？以下为你一一解读：

“画图神器”GPT-4o 的新功能

更准确的细节，“组合”再复杂也能画对
GPT-4o拥有更强大的图像生成能力，尤其在复杂元素组合（binding）上表现出色。过去，一旦你要求AI同时绘制多个颜色、形状的物体，往往会出错，比如“蓝色星星和红色三角形”可能被错误地绘成“红色星星”。

但GPT-4o能够准确处理15~20个物体及属性，让画面呈现更高精度的细节，满足复杂的场景需求。

文字生成能力跃升，告别乱码困扰

过去，AI生成的图片上文字往往存在错字、乱码等问题，影响实用性。GPT-4o则专门解决了这个痛点，可以稳定地生成清晰准确的文本。

无论是餐厅菜单、科学示意图，还是品牌宣传海报，现在用ChatGPT一键搞定，效果堪比专业设计师。

知识整合更强，随手生成高品质科普内容

GPT-4o的另一个重要特性是“知识融入”。它并非简单地生成图片，而是具备深厚的世界知识。只需一句简单提示，比如“牛顿的三棱镜实验”，你无需解释更多细节，它就能准确还原实验场景。

全新图像生成方式

GPT-4o的技术原理与传统的扩散模型（Diffusion）不同。它采用了类似人类写作的“自回归”（autoregressive）模式：从图片左上角开始逐步绘制到右下角，每一步都基于之前绘制的内容展开。这种模式显著提升了细节的精准度和文字渲染的效果。

OpenAI研究负责人Gabriel Goh透露，这个过程整整迭代了近一年，上百名人类训练员参与了细节纠错，以提升AI的画图水准。简单来说，就是AI“师从人类”，不断改进，才有了今天惊艳的表现。

所有ChatGPT用户都可使用，但免费版有限制

这次升级同时面向ChatGPT免费版、Plus、Pro及Team所有用户开放。但免费版的每日图片生成数量仍然有限制（此前DALL-E为每天3张，GPT-4o具体数字暂未公布，但预计相似）。

目前，GPT-4o生成图片的速度略慢于之前的DALL-E 3。但OpenAI表示，这点延迟完全值得，因为“图片质量和知识整合的提升远超等待几秒带来的不便。”

安全与版权问题，OpenAI如何回应？

针对AI生成图片引发的安全、版权争议，OpenAI表示已经部署了更严格的安全措施，包括：
• 禁止生成色情内容、儿童不当图像；
• 禁止去除水印、禁止模仿在世艺术家作品；
• 所有生成图片都含C2PA元数据，标记为AI生成，便于追踪来源。
OpenAI运营总裁Brad Lightcap强调，GPT-4o的数据训练中已获得Shutterstock等公司的授权，也提供艺术家内容的主动“退出”机制，保障版权与合规。

实际应用场景更多元，商业价值凸显

全新的GPT-4o不仅仅局限于娱乐、科普，它更是企业商用的新利器。例如：

• 设计团队可快速生成品牌LOGO和透明背景贴图；
• 餐厅老板一分钟做好菜单、宣传海报；
• 办公场景可直接生成演示文档和高品质图表。
GPT-4o的发布，让AI图像从“能看”升级为“好用”，进一步推动了AI商业应用的普及。

我自己测试了一下，文字生成部分真的是相当不错，可以比较稳定的生成想要的文字，这能解锁很多有价值的场景，也减少了对画图工具的依赖。

宝玉xp的微博视频