据《智能涌现》获悉,前闪极 AI 合伙人、前字节视觉大模型 AI 平台负责人潘欣,近期已经加入美团。据悉,潘欣曾任谷歌大脑(Google Deepmind)研究员,推动 TensorFlow 动态图模式开发。回国后,他先后在百度、腾讯与字节跳动任职。具体来看,百度期间,潘欣曾主导 PaddlePaddle 平台优化、无量深度学习框架构建,而后任腾讯、字节跳动 AIGC 和视觉大模型 AI 平台负责人,业务方向集中在多模态领域。此后,2024 年 11 月,其加入闪极科技,担任 AI 合伙人,整体负责 AI 技术研发及智能眼镜项目。据了解,入职美团后,潘欣负责多模态 AI 创新工作,主导了 LongCat App 等多个相关应用的开发。报道指出,2025 年,美团的关键词是外卖大战与 AI。但今年第二季度起,国内开始了轰轰烈烈的外卖大战。压力之下,美团将有限的子弹,先放在了基座模型的训练上。据知情人士透露,2025 年,美团在包括预训练、业务侧 AI 应用方面的招聘积极性并没有减少。「今年美团招聘的 AI 人才集中在模型训练方面,招聘标准也很高,人才主要来自阿里通义、Seed 以及腾讯混元团队。」2025 年至今,美团密集地发布了一系列基座模型和应用进展,如首款 AI 编程产品 Nocode、首款大语言模型 LongCat-Flash-Chat 等。报道表示,基座能力的建设,某种程度也是为美团主营业务 AI 化铺路。从 2025 年下半年开始,美团在 AI 应用侧明显提速,但更加聚焦于主线业务的 AI 化改造。
三星与 Vidu 官宣合作
日前,三星与生数科技(Vidu)正式宣布达成合作。据悉,双方合作内容主要包括:三星将通过集成 Vidu API,将更灵敏的智能交互、更生动的视觉创作能力,融入全球用户手机体验。未来,用户有望在三星手机上体验到 Vidu 最新 AI 功能。生数科技表示,与三星的携手,是 Vidu 走向全球消费市场的重要一步,也是生数科技商业化进程中的重要里程碑。据透露,双方将进一步推动「硬件 + 多模态 AI」合作模式的普及,加强多模态 AI 在端侧设备的融合与创新,继续推动前沿 AI 技术与移动生态的更多场景应用。
12 月 10 日,智谱正式发布并开源 GLM-ASR 系列语音识别模型,并推出基于该系列模型打造的桌面端智谱 AI 输入法。GLM-ASR-2512 是智谱新一代语音识别模型,支持将语音实时转换为文字。在多场景、多语种、多口音的真实复杂环境测试中,保持行业领先的识别表现,字符错误率(CER)仅为 0.0717。GLM-ASR-Nano-2512 为一个 1.5B 参数的端侧模型,取得了当前开源语音识别方向的 SOTA 表现,并在部分测试中优于若干闭源模型。其将识别能力压缩到本地运行,在保证高精度的同时,实现更强的隐私保护与更低的交互延迟。基于上述模型能力,智谱 AI 输入法正式上线。据介绍,智谱 AI 输入法基于 GLM-ASR 系列模型打造,让用户在电脑端用语音丝滑交互。用户不仅可以实现精准的语音转文字,还可以在输入法中直接调用大模型能力,完成翻译、改写、情绪转化等操作。值得一提的是,智谱 AI 输入法支持设置不同「人设」风格,实现同一句话在不同场景下的不同表达。针对开发者,智谱还推出了 Vibe Coding 体验,并与智谱 Coding Plan 账号打通。结合多语言支持与代码理解能力,开发者可以通过语音快速输入代码逻辑和注释、查找遗忘的 Linux 指令、用自然语言指挥 AI 完成复杂数学计算或脚本编写。目前,GLM-ASR-2512 模型已上线智谱开放平台,1.5B 的端侧模型 GLM-ASR-Nano-2512 上线开源社区;智谱 AI 输入法面向所有用户开放,并免费提供 2000 积分。GLM-ASR-Nano-2512:Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512魔搭社区:https://www.modelscope.cn/models/ZhipuAI/GLM-ASR-Nano-2512
近期,麦当劳也跟着可口可乐、Google 的步伐,加入了 AI 广告的队伍。据悉,麦当劳本次制作的为圣诞主题 AI 广告,围绕「假日季节是一年中最糟糕的时候」这一核心展开。然而麦当劳这条广告也没能躲过网友们的毒辣眼光。视频中因 AI 生成而产生的视觉抽搐,充斥着怪诞的角色、糟糕的色彩分级以及陈腐的 AI 对基本物理的拙劣模仿,都让麦当劳的这条节日短片备受「差评」。尽管视频播放量仅有 2 万,但麦当劳还是选择了关闭评论,最后完全下架了视频。