
1. ChatGPT记忆系统迎来架构升级
OpenAI 将 ChatGPT 记忆系统升级到 Dreaming V3,把跨对话信息从被动保存推进到后台综合与摘要管理。美国 Plus 和 Pro 用户已可使用,容量提升至原来的 2 倍;后续数周扩展到更多地区、Free 和 Go 用户。升级重点是减少旧记忆过时、纠正不准确内容,并把服务免费用户所需算力压到五分之一。
2. 台积电先进芯片供给持续吃紧
AI 云端算力、先进封装和高端制程需求继续超过供给,台积电管理层预计未来几年仍难完全满足客户需求。公司 2026 年营收增幅预期仍超过 30%,2025 年先进制程贡献 74% 晶圆收入;美国本土产能要覆盖客户需求仍需较长周期,机器人和自动驾驶被列为长期增长来源。
3. AI数据中心挤压存储芯片产能
AI 数据中心正在吸收更多 DRAM、HBM 等存储芯片产能,九个美国行业组织警告短期价格上涨和关键供应链受扰风险。汽车、零售、医疗设备、宽带和电信组织联合要求扩大产能并协调供给;DRAM 价格 2025 年已上涨超过 60%,压力正从数据中心传导到消费电子和制造业。
4. Cosmos 3开放物理AI底座
NVIDIA Cosmos 3 面向机器人、自动驾驶和视觉智能体,采用推理 Transformer 与生成 Transformer 结合的架构,统一处理文本、图像、视频、环境音和动作。Super 与 Nano 版本已开放,Edge 将面向边缘实时推理。模型、代码和数据集开放后,可缩短物理 AI 的合成数据、仿真评估和策略训练周期。
5. Meta商业智能体走向全球商户
Meta 将 Business Agent 推向 WhatsApp、Messenger 和 Instagram 商户场景,覆盖自动客服、商品推荐、预约、线索筛选和销售转化。超过 100 万商户已在测试或使用相关能力,平台还支持 Shopify、Zendesk、Shopee 等系统接入;免费启动后将逐步进入付费订阅和企业级平台化阶段。
6. Poke成为iMessage首个AI智能体
Poke 通过 Apple Messages for Business 接入 iMessage,成为苹果消息通道上首个面向消费者的第三方 AI 智能体。用户可在短信线程中处理邮件回复、日程选择、提醒事项、网页搜索、图片生成和智能家居控制等任务。Apple 将按用户向服务方收费,聊天入口成为潜在 AI 分发渠道。
7. 谷歌本地AI套件登陆Mac设备
Google AI Edge Gallery 已扩展到 macOS,Mac 用户可在本机运行 Gemma 系列模型,重点包括 Gemma 4 12B。该模型面向 16GB 内存笔记本,支持文本、视觉和音频输入,并具备代码和数据提取能力;同步推出的 Eloquent 听写工具也在端侧完成语音转写和轻度润色,强化离线隐私场景。
8. OpenClaw获Windows原生支持
Microsoft Build 2026 将本地智能体纳入系统级安全框架,OpenClaw 节点和网关获得 Windows 原生支持,并通过 Microsoft Execution Containers 约束文件、网络和执行权限。配套的 Agent 365、Defender、Entra、Intune 和 Purview 管理能力面向企业治理,本地 Agent 从 WSL/Docker 迁移到原生桌面生态。
9. Ideogram 4.0开放权重生图
Ideogram 4.0 是 9.3B 参数开放权重文生图模型,采用单流扩散 Transformer 和 Qwen3-VL-8B-Instruct 文本编码器。模型强化文字绘制、海报排版、对象位置和结构化 JSON 提示控制,在 DesignArena 隐名人评榜单进入全球第 4,适合设计、商品图和社媒素材等对文字准确度敏感的场景。
10. AI数据中心水电足迹被量化
联合国大学报告把 AI 基础设施的碳、水和土地足迹合并量化:到 2030 年全球数据中心用电或达 945 TWh,相关用水约 9.3 万亿升,相当于 13 亿人一年的基本生活用水,土地占用超过 1.45 万平方公里。环境评估重点正从训练碳排放扩展到推理、冷却、电力和芯片生产全链条。
11. OpenAI高频token消耗引发降本
OpenAI 内部最高 token 消耗者已达到约每月 1000 亿 token,外部仍存在更高用量账户,说明企业级智能体和自动化开发正在把 AI 成本推到运营层面。高频 token 消耗榜、OpenClaw 6030 亿 token 月账单、Amazon 与 Uber 的预算压缩共同显示,模型能力竞争正在转向单位成本下的有效工作量。
12. Meta闭源模型API交付延期
Meta 的 Muse Spark 是其从开源路线转向闭源平台化的重要模型,但开发者 API 从 4 月发布后多次延后,外部开发者仍缺少稳定公开入口。Meta 已在早期伙伴中测试 API,并把发布时间指向 6 月;延期反映闭源模型商业化不只依赖跑分,还取决于安全、漏洞修复、基础设施和开发生态。
13. LM Link让手机调用桌面模型
LM Studio 的 LM Link 把 Mac 等本地模型主机变成可被 iPhone 访问的私有 AI 节点,移动端请求经端到端加密连接发送到桌面模型处理。功能当前处于预览阶段,支持用户自己的本地设备、云主机或模型工作站,适合隐私敏感、想复用桌面算力而不把数据交给通用云模型的轻量工作流。
14. AI漏洞挑战GPT-5.5胜率领先
安全研究者构造含 Firebase 暴露凭据的图书评论 APK,在每次 10 美元、2 小时限制下测试模型能否读取私有评论 flag。GPT-5.5 10 次成功 7 次,DeepSeek V4 Pro 成功 3 次且每次成功成本约 0.62 美元;作者明确说明样本规模有限、不是正式科学评测,结果更适合观察智能体安全推理趋势。
关注鸭鸭,