社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

特赞联合创始人王喆:从5000家门店的行业巨头到小企业,如何踏上AIGC的洪流?

混沌学园 • 1 年前 • 248 次点击  

技术的每一次飞跃都深刻地改变着我们的生活方式和商业模式。人工智能(AI)正以前所未有的速度渗透到各行各业,引领着新一轮的产业革命。

今天,企业的竞争已不再是单一的产品或服务较量,而是基于技术创新与数据驱动的全方位竞争。

在这样的背景下,生成式人工智能(Generative AI)作为AI领域的一个重要分支,已经从实验室走向市场,成为企业转型升级的关键驱动力。

特赞科技作为一家深耕人工智能领域多年的企业,从第一代框架规则式的生成方法,到如今的扩散模型时代,特赞始终站在技术的最前沿,探索着人工智能在商业应用中的无限可能。

7月6日,混沌AI应用探索营授课老师、特赞科技联合创始人王喆,与探索营同学一同探索如何让人工智能成为企业成长的强大引擎。


混沌AI应用探索营,致力于以混沌·Light 独家一思维*探索流作为交互工具,结合AI先锋老师与企业实践案例,帮助想拥抱AI的企业管理者,用AI降本增效、产品升级,实现从“互联网+”到“AI+”。

授课老师 | 特赞联合创始人 王喆


从框架规则到扩散模型


我们经历了三代人工智能关键技术的发展。第一代技术,我们采用了框架规则式的生成方法。例如,阿里的鲁班,它的诞生源于一个简单的商业问题。

在2015年之后,随着移动互联网的快速发展,淘宝的日活跃用户数量不断攀升,那是一个流量为王的时代,几乎任何人都能在淘宝上赚钱。

三年后,淘宝推出了一个关键的产品功能,这在电商设计上具有里程碑的意义。这个功能很简单:将用户加购的商品展示在首页上,以提高购物车到成交的转化率。这个功能不仅提醒用户他们之前的兴趣,也极大地提高了用户体验。


但很快淘宝面临了一个问题:每个人的购物车商品都是不同的,面对如此多的商品和用户,谁来生成这个推荐单?成本又由谁来承担?这引出了在大规模内容下如何解决内容成本的问题。内容背后就是流量,因此第一代设计人工智能技术应运而生,它的目标是通过商品信息生成吸引人的推荐单。

我们与同济大学和阿里团队合作,研究如何将技术应用于解决这一问题。当时的技术多用于解决杂志排版问题,这与淘宝的问题有相似之处:理解商品的品类、颜色和风格,然后设计出合适的背景和标题。这就是最早的设计模式。

AI应用的二元性探索:技术革新与成本控制并重的商业实战案例


回顾AI的发展历程,我们不难发现,其初衷并非取代人类享受生活的乐趣,而是承担起那些繁重、繁琐且需要高度专注的任务。在探讨AI时,我们需从两个维度出发:技术的革新与商业的落地。遗憾的是,许多专家在阐述AI应用时,往往忽略了这一二元性,导致他们的观点略显片面。从研究者的角度看,他们热衷于探索AI的无限可能,关注其作为通用智能的聪明程度,这是典型的技术追求,旨在激发技术的想象力,并探索其在各行业的落地潜力。

然而,在商业领域,我们不得不面对更为现实的考量——收入与成本。大多数科学家在科研过程中,往往不会将成本效益放在首位,他们更专注于技术的突破与学术的交流。但在商业实践中,成本与收入却是决定项目成败的关键因素。以医学、核聚变、超导等领域为例,尽管实验室中的技术探索令人振奋,但一旦涉及商业化,我们就必须精打细算,确保技术的可行性与经济性。

接下来,我想分享一个经典的商业案例,它发生在2019年,那是一个短视频风起云涌的时代。抖音的崛起让传统电商平台感受到了前所未有的压力与挑战。为了应对这一变化,某头部电商平台在双11前夕向所有品牌提出了一个前所未有的要求:每个品牌需准备100条短视频用于推广。在那个短视频制作成本高昂的年代(每条约800-1000元),这一要求无疑给品牌带来了巨大的压力。

作为当时负责相关工作的我,面对这一挑战,决定借助AI的力量来降低成本。我们组建了一支由顶尖算法工程师组成的团队(年薪约50万至80万),致力于研发基于AI的短视频制作技术。我们的目标是将图片动态化,类似于PPT的效果,但能在短时间内完成高质量的短视频制作。经过半年的努力与投入(包括高昂的研发费用),我们终于研发出了这款产品。然而,当我们满怀信心地准备投入市场时,却发现竞争对手已经以更低的成本完成了同样的任务。


原来,我们的竞争对手并非是那些拥有强大计算资源的大厂,而是来自横店的工作室。他们利用横店的场景与演员资源,以极低的成本完成了短视频的制作。这一现实让我们深刻认识到,在商业竞争中,除了技术创新外,成本控制同样至关重要。

过去,当互联网金融刚刚兴起的时候,大家都热衷于使用真人出镜的方式来制作短视频内容,这种现象让我首次意识到市场竞争的复杂性,它往往跨越了我们最初的想象边界。就像美甲店从未预见到自己的竞争对手会是海底捞一样。这让我深刻体会到,在市场需求大规模内容的时候,如何优化成本成为了决定胜负的关键因素。即使你的AI技术再先进,在商业场景中,它的应用成本也是一个不可忽视的重要考量。

因此,我们现在需要深入思考的是,当我们引入一项新技术时,它的前期投入成本是多少?当我们希望这项技术能够规模化应用时,它的边际成本又将如何变化?我们需要带着这两个问题去审视我们的决策,以便找到最合适的解决方案。

AI如何为拥有5000家门店的行业头部企业做内容分发


在AI的发展过程中,我们也曾走过弯路。最初,我们都沉浸在通过海量数据训练出超级智能的幻想中,但随着时间的推移,我们逐渐意识到,在商业应用中,技术的稳定性和可靠性远比单纯的先进性更为重要。特别是在面向企业的应用场景中,客户需要的是稳定、可靠的服务,而不是可能出错的概率性结果。

所以,我们现在需要做的是将工程技术与AI进行深度融合。通过工程手段来提升AI的稳定性和降低成本,这样我们才能在商业场景中更好地应用这项技术。

以我们的一个客户为例,它是一个拥有5000家门店的行业头部品牌。对它来说,如何在全国范围内高效地制作和分发视频内容就成为了一个巨大的挑战。


在考虑为5000家门店每天发布一条短视频至抖音平台的成本时,不得不面对一个庞大的数字。假设每条视频的制作成本约为75元,这在当前短视频制作行业中,对于包含一定原创元素的内容来说,已经是相对经济的价格了。然而,当这个成本乘以门店数量(5000家)、天数(365天)时,一年的总成本将高达1.35亿元人民币。这样高昂的费用显然超出了许多企业的承受能力,也让人质疑其投入产出比是否合理。

面对这样的成本挑战,我们不得不深入思考:在商业与技术变革的当下,新技术是否真的能解决问题。这需要考虑如何优化内容制作流程、降低成本,同时确保视频质量能够吸引用户关注。

关于内容发布后的曝光量,通常每条视频在抖音平台上都能获得200至500次的初步曝光,这意味着视频有机会被这么多用户看到。然而,曝光并不等同于转化,许多用户在浏览过后可能并不会产生进一步的互动或购买行为。

那么,抖音平台上的短视频是如何实现流量增长的呢?这背后涉及到复杂的算法机制和用户行为分析。简单来说,当用户发布一条视频后,抖音的算法会根据视频的内容、质量以及用户的互动情况来评估其吸引力,并决定给予多少初始曝光。如果视频在初始曝光中获得了较高的点赞、评论和分享等互动指标,那么算法就会将其推荐给更多用户,从而实现流量的逐步扩大。这就是抖音短视频流量增长的基本逻辑。


在抖音平台上,视频内容首先会通过AI进行审核,这个过程涵盖了多个方面:检查音乐是否有版权问题,画面内容是否合规,语音文案中的文字是否违反规定。

一旦视频通过初审,它将被推送到第一个流量池,这个流量池通常包含200至500个初始曝光量。这意味着,无论视频内容质量如何,只要通过审核,至少会有一定数量的用户看到它。对于拥有5000家门店并每天发布短视频的企业来说,这意味着每天至少能获得数亿次的曝光机会,其中任何一条视频如果表现出色,都有可能带来数十亿的流量。

在第一个流量池中,算法会根据一系列数据指标来评估视频的表现,包括两秒跳出率、五秒完播率、平均观看时长、整体完播率,以及点赞、评论、分享、收藏等互动数据。这些数据将帮助算法判断视频内容的吸引力和用户匹配度,从而决定是否将视频推送到更大的流量池。

如果视频在第一个流量池中表现出色,它将被推送到下一个更大的流量池,获得更多曝光机会。这个过程会不断重复,直到视频达到其流量潜力的极限。在这个过程中,AI和人工审核会不断介入,确保内容的合规性和质量。

此外,抖音的算法还会根据用户的兴趣和行为,将类似的内容推送给可能感兴趣的用户,实现精准推送。这种算法机制不仅提高了内容的曝光效率,也增强了用户体验。

那么,我们的核心竞争力是什么?

在当今时代,创作一则优质视频,其背后的工作量多如牛毛,从构思脚本到拍摄剪辑,每一步都凝聚着心血。这不仅是众多品牌面临的共同挑战,更是蕴藏无限机遇的沃土。

首先,我们必须严守内容创作的底线——过审无忧。这意味着我们的作品必须远离雷区,杜绝任何不良引导,确保内容的纯净与健康。

其次,追求视觉与听觉的双重创新,降低内容的重复率。在混剪盛行的当下,我们深知独特性是吸引眼球的关键。无论是画面的精心编排,还是语音文案的匠心独运,我们都力求避免雷同,让每一帧画面、每一句台词都能触动人心。

然而,站在商家的立场,或许会对“商品概念重复说”的限制感到不解。但换位思考,当我们置身于消费者的视角,便能深刻理解那份对新鲜感的渴望。平台作为内容生态的守护者,其职责在于平衡广告与用户体验,确保每一位用户都能在刷视频的过程中,收获愉悦而非厌倦。

深入剖析大平台的运作机制,我们不难发现两大核心角色:产品研发团队与商业化团队。前者致力于提升用户满意度,后者则聚焦于广告变现。两者之间的微妙平衡,正是平台持续发展的动力源泉。而我们的目标,正是利用人工智能的力量,以更低的成本、更高的效率,助力内容突破重围,赢得初始流量池的青睐。

此外,我们还需直面一个现实问题:经销商群体的数字化技能参差不齐。这要求我们在设计产品时,必须充分考虑其易用性。一个成功的系统,应当像微信一样简洁明了,让经销商能够轻松上手,无需复杂的培训即可完成视频发布等任务。

回顾过去两年的实践,我们深刻体会到简化流程、提升用户体验的重要性。只有当我们的产品足够简单、足够直观,才能真正打通经销商与消费者之间的桥梁,实现市场的深度渗透。

因此,我们的策略清晰而明确:首先,利用人工智能优化视频制作流程,降低成本、提高效率;其次,简化发布流程,确保经销商能够轻松完成视频发布任务。这两步棋一旦走稳,我们的品牌便能在激烈的市场竞争中脱颖而出,实现内容与市场的双赢。

此外,通过巧妙安排不同门店发布不同内容(如产品介绍、门店促销等),我们能够有效减少内容重复,避免给算法带来不必要的挑战。服务5000家门店,我们可以按照日期规划内容发布,确保每日都有新鲜、多样的内容呈现给受众。

关于每日生成5000张不重复图片的问题,这是许多行业都在面临的挑战。无论是饮料还是电子产品,未来的趋势都指向了高度个性化的内容生成。在过去,为了获得一张精美的产品图片,我们需要投入大量的时间和成本进行拍摄、设计和后期处理。但现在,随着AI技术的发展,我们可以更加高效地解决这个问题。

AI技术通过模型化背景、结合前景、优化光影等手段,能够生成既真实又个性化的图片。更重要的是,这些图片可以实现不重复,因为AI能够根据不同的需求和参数生成独一无二的背景。这样,我们就可以通过分层叠加AI技术的方式,实现图片的批量生成和审核。

具体到个性化图片的生产流程,我们首先会确定一个主视觉风格,然后,我们会制作一些模板,这些模板会预留出放置产品的空间。接下来,AI会负责解决背景不重复的问题,通过生成多样化的背景来确保每张图片的独特性。

同时,我们还会在图片上添加品牌信息和门店信息,以满足不同门店的个性化需求。这样,我们就可以轻松地实现每日5000张不重复图片的生成目标。

最后,当需要制作视频时,我们也会采用类似的高效流程。我们会精心策划视频内容,包括产品亮点介绍、功能演示等,并利用专业设备进行拍摄和后期剪辑。

视频首先被细分为多个短暂片段,每个片段的时长依据其背后的语义内容灵活设定,可能是一秒、两秒或三秒不等。这一过程中,语音识别技术被巧妙应用,将每个片段的语音内容转化为文字,随后通过大语言模型对这些文字进行深度分析,识别出它们各自的主题——无论是产品介绍、卖点阐述还是局部特征展示。

拥有了这些精心分类的片段后,我们进入了一个更为宏大的创作阶段。利用大语言模型,我们编写全新的脚本,这些脚本随后被拆解成词组,每个词组都与之前分类的视频片段形成对应关系。当脚本中的词组数量与视频片段库中的素材数量相乘时,便产生了海量的视频组合可能,比如10个词组对应10个产品,即可形成100种独特的视频内容。这种组合式的生产方式极大地丰富了视频内容的多样性,完成了每天高达5000条视频的需求。

面对原始素材不足的问题,我们采取了与品牌共创的策略,学习并借鉴品牌的销售经验,了解产品的核心亮点和卖点。通过构建一张包含产品各个方面信息的图表,我们能够将复杂的产品信息转化为易于理解和操作的词组,进而在素材库中筛选出与之匹配的视频片段。

最终,用户可以根据自己的需求设定视频的尺寸、是否添加画中画、个性化的开头或结尾等元素,并通过一键操作完成视频的生成。整个过程不仅高效而且灵活,能够迅速响应市场变化,满足多样化的内容需求。

在确定了产品的关键信息后,我们会构建一张详尽的图表,将外观设计、技术特点(如彩色PP材质、显示屏等)、以及核心卖点(如性价比、续航能力等)一一列出。这张图表不仅帮助我们梳理了产品信息,还为我们将产品信息转化为视频内容提供了清晰的框架。

接下来,我们利用这张图表生成一系列关键词,我们利用这些关键词去筛选和整理原始的素材库。通过这一过程,我们可以快速识别出哪些关键词下的素材丰富,哪些则相对匮乏。

在素材整理完成后,我们利用AI技术进行批量采购和拼接。AI能够根据脚本中的卖点和素材进行智能匹配,生成大量不同排列组合的视频内容。这些视频内容不仅创意独特,而且能够精准地传达产品的核心卖点。


在整个内容创作与分发的过程中,我们注重协作与效率。经销商负责准备原料和拍摄素材,总部则负责排计划、设计脚本和分发内容。通过一键分发功能,我们可以迅速将内容传递给经销商,并确保他们在保留自己IP的同时,能够快速、高效地完成发布。

小型企业如何用AI提效?


即使只有几家或几十家店的小规模生意,也可以利用AI技术来提升效率。市场分享标准图是一个经典的系统分析工具,可以帮助我们理解在AI环境中多个智能体如何相互交互。通过实验,我们可以看到在动态变化的环境中,不同角色如何完成任务和交互。


不管你的组织规模如何,未来可能会有新的工作流程需要适应。就像计算机编程一样,你需要将业务逻辑拆解成多个可管理的小任务,并设计它们之间的协同关系。这样,每个人的职责都会非常明确,即使在大型模型中也是如此。通过这种方式,AI可以在任何环节发挥作用,无论是全职员工还是实习生,都可以有效地融入这个系统。

当我们今天思考任何业务时,首先要考虑的是,在我的业务中,以前需要多少人来完成特定的工作?是3个还是5个岗位?他们需要哪些技能?在AI时代,我们考虑的是如何将这些工作转化为智能体的任务,这些智能体背后是工程还是其他什么?

如果智能体能够完成人的工作,首先要学会的是这种思维方式。基于这种思维,我们需要思考:比如,如果你需要产生5000张图,这是一个典型的业务问题。你要考虑的不是谁来做这个任务,而是这个任务是否适合由其他人或智能体来完成。如果不适合,你可能需要先找一个品牌经理或创意总监。

接下来,基于主视觉确定主题,然后撰写PPT。完成后,谁来审查?拍摄完成后,谁来做决策?在过去,这些工作是由设计师完成的,但现在,是否可以让实习生使用产品模式来完成?因为核心风格和体系已经确定,实习生的工作就是按照我们选定的图片,进行技能组合。

如果你以前设计5000张图,你会有一个设计团队,与品牌经理对接,确定主题,然后将任务分配给10个小组,每个人每天完成几张图,检查后重复。这是在纯人工时代你的工作量思考方式。

在AI时代,你需要考虑的是,哪一步工作仍然需要人工完成,哪一步可以由智能体或程序来完成。这个程序由谁来编写?

如果你的企业今天想拥抱AI,你需要做的第一件事是业务抽象。我们建议老板或业务负责人来做这个工作,因为他们对业务最熟悉。第二件事是业务设计,即设计每一步的具体流程和交付物。第三件事是至少有一个人要懂一些人工智能,可能是会编程的,可能是能够实践的,可以在内部培养,也可以是外部合作。

有了这些人,你就可以开始用新的工作流做实验,比如先用10%的业务量来尝试,然后逐步增加到20%、30%、50%。一旦流程顺畅,你的业务就跑通了,人才结构也就随之改变。

最后,我想说的是,无论企业规模大小,都可以逐步拥抱AI,用一种成本可控、对业务影响可控的方式来做。如果企业面临更大的挑战或机会,也可以用更大的投入来做服务。


混沌AI营第二期火热报名中~
专为企业管理者打造的AI+行动指南,带您从"互联网+"迈入"AI+"时代。由AI领域先锋亲授,结合实战案例,线上线下双模式教学,2个月深入掌握AI核心技能。
探索工作坊、闭门分享,加入"AI圈子",与行业精英深度交流。


点击下方“阅读原文”报名

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172427
 
248 次点击