社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

百度蒸汽机2.0发布:成本降至七成,AIGC视频将进入普惠时代

财经网科技 • 2 月前 • 141 次点击  


作者|易婷

编辑|靖程



AI视频生成正成为大模型竞争的核心战场,成本与质量的平衡逐渐成为行业比拼的关键。

 

8月21日,百度在“热AI大会”上发布蒸汽机2.0,Turbo、Lite、Pro及有声版同步上线。新版本在语音与画面同步、多角色对话生成、中文场景适配等方面进行了升级,并将定价大幅下调,刊例价相比同类产品下降至70%,让好莱坞百万级特效成本降至“百元”。

据百度副总裁、移动生态商业体系负责人陈一凡透露,降本背后是百度长期在GPU算力架构和工程优化上的积累。“自2016年起,商业研发团队就率先在搜索广告场景中引入GPU,形成了软硬件结合的技术路径。本次蒸汽机迭代,依托百度智能云‘百舸’平台与自研昆仑芯片,与策略工程架构和底层算力结合,推理效率和算力利用率得到大幅提升,从而支撑了价格下探。”

 

在国内外厂商加速迭代视频生成应用的背景下,百度蒸汽机选择以“技术突破+价格下行”同时发力,意在撬动更大规模的创作者和商业市场。


技术突破与产品升级:

从“一体化”到“可用性”

 

相比文字和图像生成,视频生成的难点在于多模态的统一:画面要连续自然,声音要真实可信,更重要的是口型、表情、动作与语音节奏要完全对得上。百度商业研发首席架构师李双龙在沟通会上直言,这正是蒸汽机团队要攻克的核心难题。“我们要做到形、声、音、容一体,而且是多角色的一体化。最大的技术难点就是如何让多个角色在同一段视频里实现语音、表情、动作等多元素依据用户指令自然协同互动。”

 

与业界常见的“多阶段”路径不同,蒸汽机采取端到端的生成方式,不再预先设定角色顺序、台词和音色,而是通过统一的潜在空间规划,让模型在生成过程中自主决定人物的对话逻辑与互动情绪。这种方式避免了“合成痕迹”,呈现出的效果更接近真实拍摄。李双龙解释说:“当下业界主流模式会通过人工预置的方式来安排谁先说、谁后说,而我们希望它能在生成中自己规划。这是一个从分段式到整体式的变化。”

 

这种“一体化”的思路,带来的直接结果就是“可用性”的提升。无论是面对侧脸、遮挡等复杂场景,还是需要多角色同时发声的长镜头,蒸汽机生成的视频都能保持稳定。百度商业体系的研发AIGC负责人韩聪补充说,这种端到端架构的价值,在于为创作者提供“开箱即用”的体验,而不是要求用户具备专业后期技能。

 

在现场展示中,这一点被充分印证。国际视效指导姚骐用蒸汽机制作的短片《归途》包含40多个镜头,最终通过AI生成超过120段素材,几乎涵盖了灾难片常见的运镜与特效。与传统电影制作相比,这些效果的生成并不依赖于演员表演或复杂的物理模拟,而是通过模型的多模态同步完成。他评价说,这种方式“让过去只能靠百万级预算才能实现的镜头,第一次变得触手可及”。

蒸汽机2.0的推出,并不是单纯追求画面精细度的提升,而是一次“工程化可用性”的迭代。正如李双龙所言,“真正的挑战不是生成一个Demo,而是把模型做成一个可以稳定、持续产出内容的工具。”


降本逻辑与商业模式:

从技术积累到价格革命

 

如果说蒸汽机2.0的技术突破解决了“能不能用”的问题,那么价格体系的调整则直接决定了“用得起”。在本次发布会上,百度宣布蒸汽机刊例价相比同行下降到七成。这一数字在行业里引发强烈关注:在其他厂商仍以千元甚至上万元计费时,百度将视频生成的成本压缩到百元级别,意味着门槛被真正拉低。

这一降幅并非来自“补贴换量”。陈一凡在会后沟通中解释,蒸汽机的价格优势源自团队多年来在GPU算力和工程优化上的积累。“刘林的团队从2016、2017年起就在用GPU做搜索、广告和推荐,这使得他们对基于GPU的架构非常熟悉。正因为这些经验,我们在训练时就能兼顾质量和成本,把推理效率和算力利用率压到极致。”

 

在研发环节,团队则采取了多项降本策略:

 

1、训练阶段:通过算子优化和数据集调整,在保证效果的同时减少冗余计算。

 

2、推理阶段:在模型架构上进行工程化改造,避免传统扩散模型时长提升带来的指数级成本增长。

 

3、底层算力:依托百度智能云“百舸”平台和自研昆仑芯片的适配,形成了软硬件结合的成本压缩能力。

 

对此,百度商业体系商业研发总经理刘林表示:“大家的硬件成本是一样的,关键看谁能把真实成本压到更低。我们有更极致的性能压缩和价格优化,所以才有降到七折以下的空间。”

 

价格调整对商业客户的影响最为直接。以一汽-大众揽境七夕广告为例,传统拍摄需要演员、布景、后期特效等多重投入,费用高昂。而在蒸汽机的生成流程下,团队只需输入脚本,即可生成融合剧情与卖点的完整视频,成本降低到千元以内,制作周期从数周缩短至一周。另一案例是伊利倍畅的品牌宣传片《漂“羊”过海来看你》,原本4-6周的制作周期被压缩至数日,且无需额外的配音与特效制作。

 

这种降本逻辑,最终不仅惠及大品牌客户,也扩展到更广阔的中小企业市场。陈一凡透露,很多中小企业并没有成熟的广告团队,也负担不起高昂的外包费用,“但通过蒸汽机,他们能用很低的成本把工厂、产品甚至节日创意变成视频物料,然后直接在百度的搜索和信息流中分发。”

 

换句话说,蒸汽机的降价并不是单纯的价格竞争,而是把AIGC视频的受众从少数头部广告主,扩展到了更广泛的创作者和企业用户。这也是百度选择“工程降本”而非“市场补贴”的原因所在:唯有真正压缩成本,才能让价格下探具备可持续性。


行业竞争与生态落地:

从赛道“内卷”到平台价值

 

过去半年,AI视频生成赛道的竞争愈发激烈。Sora、可灵、即梦等产品相继推出,Demo层出不穷,但在质量、时长、交互稳定性上仍存在明显瓶颈。百度蒸汽机的切入点,并非单纯追逐画质上的极致,而是把重心放在中文场景与生态落地的可持续性。

 

在会后沟通中,陈一凡强调,激烈的竞争并未让团队感到焦虑,因为蒸汽机从一开始就是“内部需求驱动”:“只要在搜索、信息流、商业这些场景里质量好,分发量和收益自然会提升。”

 

数据显示,目前百度搜索中已有超过六成的流量带有AIGC生成内容,这些内容并不是对传统结果的替代,而是通过质量提升增强了用户体验。对百度来说,蒸汽机的意义在于驱动整个搜索与内容生态的增长,而不仅仅是模型调用次数。

 

这种定位也决定了蒸汽机的角色。陈一凡坦言,它不是一个独立品牌,而是百度生态的底层支撑。“如果能让搜索收入提升一个点,就是几十亿级别的变化,这比单独计算模型调用营收更重要。”

 

从具体落地来看,蒸汽机已经贯穿百度的多个业务场景:在搜索中,用户可以一键生成视频,完成从脚本到成片的体验;在内容生态,百家号创作者借助AIGC工具突破了视频创作门槛;在营销场景,客户通过擎舵平台即可调用视频生成,部分功能甚至免费开放;在企业市场,蒸汽机依托千帆大模型平台,为营销、影视、创意特效等场景提供高性能、低成本的视频生成服务。这些应用共同构成了一个完整的链路,使蒸汽机不再是单一的技术产品,而成为百度生态的关键基础能力。

 

在愈发“内卷”的赛道里,这种生态打法或许正是百度的差异化所在。蒸汽机不是靠Demo博眼球,而是通过持续的内部应用和商业化积累,把视频生成能力嵌入搜索、内容和营销的底层逻辑,逐步扩展出更大的行业想象空间。



   推荐阅读   

END

微信号|Taigeeker

新浪微博|财经网科技

财经网科技

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/185903