Py学习  »  chatgpt

阿里的AI超级入口来了!千问 App 要如何做中国的ChatGPT?

十字路口Crossing • 3 周前 • 40 次点击  

Qwen 系列全家桶集结。

👦🏻 作者: 镜山

🥷 编辑:Zeo

🧑‍🎨 排版: NCon

loading

11 月 14 日,在经过多天的「阿里正在秘密策划一个项目」的舆论猜测后,谜底终于揭晓:

阿里的 AI 超级入口项目,基于 Qwen 模型打造的千问 APP 上线,明确对标 ChatGPT 最新的 5.1 版本。


朱啸虎发了一条朋友圈,说这是在「硬刚」ChatGPT,哈哈。


loading


这是阿里今年宣布的又一个集团战略项目。继 AI 基建、淘宝闪购之后,负责人是阿里巴巴智能信息事业群总裁吴嘉。


千问 APP 由此前的通义 APP 和夸克 AI 对话助手升级而来,接入了阿里通义实验室最新的 Qwen 3-Max 模型。


这是一个非常强的战略信号。阿里把那个已经在全球开发者和技术圈里,被验证过的模型能力,毫无保留地灌注到这个统一的 C 端旗舰入口里 。


loading


这次「正名」,标志着 Qwen 不再满足于「墙外香」,而是要正式「杀回」国内,用一个「全家桶」超级入口,正面迎战已然白热化的 AI C 端战场。


要理解阿里为何在此刻做出这个动作,我们就必须先厘清,那个「认知差」到底有多大。

只在「墙外开花」,对阿里来说反而有点亏

首先,我们得厘清一个「认知差」。


在国内,我们提到阿里的 AI,可能首先想到的是「通义 APP」。但在全球的技术和开源社区,真正「杀疯了」的,是它背后的模型家族「Qwen(也就是「千问」)」。


这就导致了一个很有意思的现象:在千问 APP(原通义 APP)正式面向国内 C 端用户之前,Qwen 模型早已在海外「墙外开花」,引发了科技圈的热烈讨论。


这种「墙外香」的状态,对阿里来说,其实反而有点「亏」,明明有 SOTA 模型的能力,国内用户却感知不强。


那么,这个 Qwen 在海外到底有多火?


就在两周前,有一场引起全网关注的「首届 AI 模型交易大赛」,也叫 Alpha Arena。这场比赛被称为「币圈版的图灵测试」,规则很硬核。


每个参赛的大模型,包括 Qwen3 Max、GPT-5、Grok 4、Gemini 2.5 Pro 等目前最 SOTA 的模型,都获得了 1 万美元的真实初始资金,在真实的加密货币市场进行全自动交易,全程无人干预。


比赛结果非常戏剧化,最终 Qwen3 Max 成了少数的盈利模型之一,并且以 22.3% 的收益率夺得冠军。


loading


 Qwen3 Max,仅仅是这个大家族中的一员。在过去的几个月里,Qwen 系列模型的身影几乎「屠榜」了各大 AI 技术社区。


这里,我们说几个最受技术社区关注的「明星模型」。


比如,在 2025 年 9 月 Hugging Face 公布的模型趋势榜中,通义旗下就有 7 款模型进入全球前十,这种密度放在开源社区里是非常罕见的。


loading


其中几款经常被开发者点名的模型包括:

  • Qwen3-Max:大模型中的「全能型」基座,在 Chatbot Arena 排到全球第三;在斯坦福大学教授吴恩达的 Artificial Analysis 榜单中被视为「性能最高的非推理模型」之一。

  • Qwen3-235B:在 Chatbot Arena 开源模型里排在第一。

  • Qwen3-VL:视觉方向的主力,在 Vision Arena 里全球第二、开源第一。

  • Qwen-Image:在文生图赛道全球第五、开源第一,图像编辑能力排名全球第二。

  • Qwen3-Coder:编程模型的头部玩家,与 Claude 4 并列,且在多个评测里超过 GPT-4.1。

  • Qwen3-Omni:覆盖音视频交互,在 32 个权威测试里取得开源第一。


这些能力也不是只存在于参数表格里。


Qwen3 的多款模型,包括视觉、图像、生图、音视频,都已经实际集成进千问 APP,成为它真正的底层能力来源。


更关键的是,围绕这些模型的评价,往往与实际业务使用有关。


loading
Airbnb CEO 表示正大量依赖阿里巴巴的通义千问模型


换句话说,在千问 APP 还没「回国亮相」之前,Qwen 的模型已经在海外被接触、测试、引用甚至依赖了。


对于阿里来说,这种「墙外先火」的节奏多少显得有些微妙:技术早已得到验证,但国内用户直到现在才真正有一个能直接体验全部能力的入口。


也正因为如此,千问 APP 就显得更值得一看,它不仅是一个应用产品,更像是一次「让国内用户第一次亲手体验 Qwen 全家桶」的窗口。


loading

普通人视角的「千问玩法」

如果把千问 APP 当成一个面向普通人的工具,那它想解决的问题其实很简单:让你问一句,它能给到真正有用的答案。


其次就是多模态能力。


现在大家提问不只靠打字,拍截图、拍题、拍菜单早就是日常操作。国内用户更是习惯用「以图搜图」「拍照提问」解决问题。


整体来看,千问 APP 想解决的,就是解决这些日常场景里的普通人每天都会遇到的痛点。


这其实也是一款「APP」最基本的素质。


接下来,我们就用几组真实场景,来看看千问 APP 依托 SOTA 模型,在日常生活里到底能给体验带来多少提升。

DeepResearch

11 月 14 日,千问再升级了 DeepResearch。


接下来,我们就来试一试这个功能。


提示词如下:




英伟达凭什么持续领跑 AI 赛道?


loading


千问 APP 的 DeepResearch 直接整出来了 8000 字的完整深度研究报告


loading


它把英伟达的护城河拆成四块:GPU 架构、CUDA 生态、AI 工厂战略和未来技术布局。


每一部分都有节奏、有因果、有例子,读起来不像自动生成,更像一个懂行业的人在讲解。


其次,它处理细节的方式很稳,能给出非常密、非常具体的数据:比如 GPU 的迭代周期、Blackwell 架构的算力指标、CUDA 生态的开发者人数、量子计算的通信延迟、医疗与汽车行业的实际加速案例等等。


loading

AI 修图

AI 修图里,千问用的之前非常有热度的 Qwen-Image 模型。


比如,下面这只小狗是我在短视频平台看到的,我就顺手把它上传到了千问的「AI 修图」功能里,输入提示词:


可以看的出来,整体的效果还是不错的,这种操作流就很方便:


loading


它理解得很快,边缘处理也干净,连毛发的细节都保留得不错。


AI 修图这个功能里,甚至你能明显感觉到千问在 C 端体验上花了不少心思。


除了基础的擦除和补图,人像修图里也做得很「日常化」。它没有把功能做成那种很专业、很多按钮的 UI,而是直接把场景化的需求塞成一个个按钮。


比如说,人像修图里面已经集成了非常的场景化的功能,像是:添加滤镜,HD 变清晰,扩图等等。


loading


这次依然请来了我们的 Koji 老师客串模特。我用千问 APP 直接粗暴地把他扣了出来,然后套了个滤镜、调了点磨皮,完全没做复杂的操作:

(他自己看了之后又一次表示「还挺帅的」,我怀疑他本质上在享受被当测试素材的感觉)


loading
loading
loading


最近在各个社区里,「食材选美大会」都非常火,所以我就试着让千问帮我做个「红烧肉选美大赛」,直接整 16 张红烧五花肉图片,每一张都非常相似,但其实真的会有「不一样的地方」:


loading


而且每一张都类似,但会在细节上偷偷变一点,像是油亮程度、边角弧度、光泽反射、肥瘦比例。


然后我又试了一个「香蕉选美大会」:


loading


这一圈试下来,千问 APP 背后的图像模型基本就是「够用且友好」。


可以看的出来,千问 APP 背后接的图像编辑模型的效果其实已经非常够用了,尤其是在阿里最看重的「C 端用户」。

万相 AI 视频

修图之后,我们再看看它的 AI 视频功能。千问这次接的是自家的通义万相模型,就是之前在各个平台上很火、被用来做创意短片的那个,而且千问 APP 里现在已经集成了很多短视频平台很火的模版。


我又「借用」了 Koji 老师,让他出演了几个实验性视频,结果出来的效果都让我觉得:

嗯,万相还是那个熟悉的万相,一致性和画面感依旧很抗打。


比如这个《飞得更高的 Koji》,风格很轻松:



这个是非常火的《角色小人转换》,Koji 的五官、衣服、体态都保持得很好,完全没有「模型突然忘了谁是谁」的那种跳脱感。



还有一个《人物转身》模板,万相这一代很有优势的点之一就在于:人物转身、侧脸、背影都能保持一致:



能看得出来,AI 视频背后接的万相模型还是非常抗打,人物一致性都保持的比较好。


从这几条样片能看得出来,千问 APP 的视频模块已经对普通用户足够友好:低输入(几张图 / 一个视频)→ 高产出(完整短片)


尤其在 C 端用户的日常使用里,完全能当作一个「随手生成好玩的短视频」的创作工具。

AI 创作和智能体市场

在千问 APP 里,我发现集成的「AI 创作」和「智能体」功能,现在都被理的更顺了,放在了主页面左侧:


loading


这些小的「AI 产品」目前在千问 APP 里算是优化过一次工作流了,每一个点进去都还是有比较成熟的效果体现。


比如,我知道很多朋友一开始选择用「千问 APP」的老版本「通义 APP」的原因就是:算命占卜,周围很多朋友的是出于这个理由下载的。


所以,我又随机点进了一个使用量非常高的「塔罗占卜」智能体里,测了下最近我跟 TA 的感情运:



先不说结果如何,这个智能体的 UI 就还不错,已经在交互上比较成熟了。我又试着翻了翻「AI 创作」和「智能体」,里面的集成的数量非常多。


基本涵盖了「生产力场景」和「情绪价值场景」的大多。


所以,看完这么多千问 APP 的能力,我们再回过头来看「通义」改名「千问」这件事 ,背后的战略就非常清晰了。


这叫「正名」。


过去,阿里的 AI 布局很广,但 C 端用户对「通义」的认知,和 B 端开发者对「Qwen」实力的认知是脱节的。


这次更名,就是要把这两者强行拉平。


阿里似乎在说:

别再把千问 APP 当成一个普通的聊天机器人了,它现在是「体验最新、最强 Qwen 大模型的第一入口」。


这也解释了为什么千问 APP 的功能看起来如此「大而全」。


【1】如果用户想识别图片、做多模态推理?

它调用的是在 Vision Arena 上排名全球第二、开源第一的 Qwen3-VL 。


【2】如果用户想写代码?

它调用的是编程能力登顶全球开源模型(并列第一)的 Qwen3-Coder 。


【3】如果用户想文生图?

它调用的是在图片编辑能力上排名全球第二、开源第一的 Qwen-Image 。


现在,阿里正试图通过「千问 APP」,把这些硬核的专业能力,第一次全面开放给每一个普通用户。

🚥

所以,从「通义」更名为「千问」,已经不只是一次简单的品牌升级。


这是一个清晰的战略信号


它标志着阿里不再满足于「墙外开花」,在海外社区和 B 端被开发者们「封为源神」 ,而是要正式「香」回国内。


用一个统一的旗舰产品,正面迎战国内本就激烈的 AI C 端产品市场(尤其是 AI ChatBot)的激烈搏杀 。


过去 3 年,我们总在讨论:「怎样才能够硬刚 ChatGPT?」


但从阿里的这次布局来看,他们正在准备一个自己的回答:

一个强大的、覆盖全模态的「模型家族」 + 一个全球 TOP 的「开源生态」 + 一个统一的「C 端超级入口」


把以上三者合一,或许才是阿里心中「能够硬刚 ChatGPT」的真正形态:一个更聪明、更全面的国产 AI 。


未来,我们也非常期待看到国内的 AI 技术带来更多惊喜和实质性的进展。





loading

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/189314