社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

【民生AI体验官】Sora 2:创造力的ChatGPT时刻

计算机司令部 • 2 天前 • 31 次点击  

OpenAI全新视频生成模型Sora 2体验

一、音视频同步生成模型 + AI短视频平台,开启视频领域的GPT-3.5时刻


据IT之家、AI寒武纪,10月1日凌晨,OpenAI 发布了下一代视频生成模型 Sora 2。相比初代Sora模型,Sora 2在物理世界的准确性、真实感和可控性方面都实现了巨大飞跃,并首次加入了同步对话和音效生成功能。从生成的视频质量来看,Sora 2已正式升级为音视频同步生成模型,能够更好地遵循遵守物理定律、理解和执行复杂的指令,并能够将现实世界的元素直接“注入”到视频生成中。用OpenAI自己的话说,初代Sora是视频生成的“GPT-1时刻”,而Sora 2则直接跃升至视频领域的“GPT-3.5时刻”




同期推出的新版 App 形态为一个完全由AI来生成视频的短视频平台,用户可以通过一次性录制自己的视频和语音来完成身份验证,并体验颠覆性的社交玩法-“Cameo(客串)”的真人穿越功能将自己一键置入AI生成的视频场景中与现有社交媒体相似,Sora APP提供算法推荐的信息流,根据互动对象和兴趣推送个性化内容,并引入“可调节排序”功能,让用户进一步定制看到的内容。目前Sora APP只在IOS系统提供(首批上线地区为美国和加拿大,计划将迅速扩展到更多国家),应用采用邀请制进行推广,成功注册的用户将获得四个邀请码,可以分享给自己的朋友。



二、核心功能实测:精准物理交互 + 现实推理能力 + 音效生成 ,营造极高真实感


1)物理交互


Sora 2 在物理世界的模拟上达到了前所未有的高度。团队在发布中强调,新模型在运动(motion)、物理(physics)、智商(IQ)和对真实身体运动规律的精准模拟(body mechanics)方面都达到了业界顶尖水平。这意味着 Sora 2 能够更准确地理解和模拟复杂的物理交互。从生成的视频效果来看,视频中人物动作流畅自然,很难察觉AI生成的痕迹。


例如,在官方发布的花样滑冰场景中,运动员的跳跃和转体姿势非常流畅人体形态并未发生扭曲




在多人场景中,Sora 2 画面的物理表现同样出色,棒球的飞行轨迹逼真,击球时具有力度感,同时击打时机与音效完美同步(背景音竟然还是中文音效)。此外,我们仅仅向Sora 2提出模拟击球画面,但Sora 2还对击打后棒球的飞行轨迹进行了模拟,反映该模型除了忠实执行指令外,还具备基于物理原理的真实世界推理能力



还有F1赛事、战争片等宏大场面:




当然Sora 2也并非完美无瑕,在跳伞场景中部分细节处理存在问题(如降落伞打开前后不一致等),在我们尝试生成的体操、烹饪等场景中,人物肢体动作也存在不自然的情况。




2)创意内容生成


创意生成领域,Sora2能够帮助我们生成更多天马行空的动画场景,例如孙悟空大战二郎神:



RPG游戏试玩中,Sora2 成功复制出与小怪进行战斗时的画面,野怪血条对应减少直至被消灭,同样展现出模型具备推理的能力。此外,游戏画面也与现实游戏的相似度极高,反映出Sora 2 基于现实游戏进行了一定量的训练并完成了信息提取。



3)添加现实内容


此外,Sora 2的一大亮点在于,可以将现实世界的元素直接“注入”到视频生成中。在生成视频界面,我们能够直接选择OpenAI的CEO Sam Altman等人物,目前全网已经产生了大量以Altman为原型的有趣视频。



官方网站中也提供了大量范例。


被鸵鸟叼走了帽子:



两个人在掰手腕:




4)测试环境


除了物理交互以外,一系列网络测试验证了Sora 2同样具备强大的模拟交互和代码能力。例如,我们让Sora 2模拟 ChatGPT对用户输入的反馈,Sora 2生成的视频不仅预测了ChatGPT的输出,甚至生成了按键音和机械音回答的音效,以视频生成的模式替代了生成式AI的功能:



在代码场景下,Sora2渲染HTML代码输出的效果与真实浏览器中渲染保持高度一致。其中,上面的图为浏览器运行html的结果;下面的图为将html转化为提示词后,Sora 2输出的结果:





5)社交APP


Sora App 的界面设计看起来非常像抖音,包括内容流、个人主页等界面,不过APP的短视频均为AI生成。在这个APP中,用户可自定义的Sora动态中浏览新视频,并通过“客串(Cameos)”功能将自己或好友引入到视频中。同时,为了保护肖像权,用户在APP中能够完全掌控自己的形象使用权,可随时撤销权限或删除含有本人 Cameo 的视频。





三、体验总结


与之前的视频生成模型相比,Sora 2在遵循物理规律、复杂的多镜头指令、音效生成等方面取得了重大飞跃,极大地重塑了内容创作领域,被称为视频领域的“GPT-3.5时刻”。 同时,OpenAI推出的Sora APP直接对标AI版本的Tiktok,依靠全新的客串功能,引领了AI时代社交互动的新范式。


体验亮点:

极高的真实感与可控性:动作衔接流畅丝滑,支持多复杂的镜头组合

逼真的环境音效:能够生成说话者语言、环境音等多种音效,正式升级为音视频同步生成模型

AI版抖音打造全新社交神器:视频模型不仅提供了新的内容生成方式,还有望重塑人际沟通方式。Sora APP打造由AI生成视频的短视频平台,通过Cameo等新颖玩法吸引用户,推动模型出圈和未来的商业化探索



图片


资料来源:OpenAI,民生证券研究院整理


免责声明:基于公开资料和信息整理和产品实测,测试结果仅供参考,任何情况下不代表民生证券意见;或有翻译错误及信息滞后、更新不及时不全面的风险;任何情况下,不构成投资建议。

所有生成视频均由Sora 2模型AI生成,如有侵权,请联系民生证券研究院删除。




计算机团队介绍

吕伟:执业证书:S0100521110003

民生证券计算机行业首席分析师,北京大学理学硕士,2021年加入民生证券研究所


分析师承诺

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。



重要提示

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号/本账号发布的观点和信息仅供民生证券的专业投资者参考,完整的投资观点应以民生证券研究院发布的完整报告为准。若您并非民生证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号/本账号中的任何信息。本订阅号/本账号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号/本账号推送内容而视相关人员为客户;市场有风险,投资需谨慎。


免责声明

民生证券股份有限公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。

本报告仅供本公司境内客户使用。本公司不会因接收人收到本报告而视其为客户。本报告仅为参考之用,并不构成对客户的投资建议,不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要,客户应当充分考虑自身特定状况,不应单纯依靠本报告所载的内容而取代个人的独立判断。在任何情况下,本公司不对任何人因使用本报告中的任何内容而导致的任何可能的损失负任何责任。

本报告是基于已公开信息撰写,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、意见及预测仅反映本公司于发布本报告当日的判断,且预测方法及结果存在一定程度局限性。在不同时期,本公司可发出与本报告所刊载的意见、预测不一致的报告,但本公司没有义务和责任及时更新本报告所涉及的内容并通知客户。

在法律允许的情况下,本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务,本公司的员工可能担任本报告所提及的公司的董事。客户应充分考虑可能存在的利益冲突,勿将本报告作为投资决策的唯一参考依据。

若本公司以外的金融机构发送本报告,则由该金融机构独自为此发送行为负责。该机构的客户应联系该机构以交易本报告提及的证券或要求获悉更详细的信息。本报告不构成本公司向发送本报告金融机构之客户提供的投资建议。本公司不会因任何机构或个人从其他机构获得本报告而将其视为本公司客户。

本报告的版权仅归本公司所有,未经书面许可,任何机构或个人不得以任何形式、任何目的进行翻版、转载、发表、篡改或引用。所有在本报告中使用的商标、服务标识及标记,除非另有说明,均为本公司的商标、服务标识及标记。本公司版权所有并保留一切权利。


民生证券研究院:

上海:上海市虹口区杨树浦路188号星立方大厦7层;邮编 200082 

北京:北京市东城区建国门内大街 28 号民生金融中心 A 座 18 层;100005

深圳:深圳市福田区中心四路1号嘉里建设广场1座10层 01室;邮编518048






Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/187443
 
31 次点击