社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

AIbase基地 • 5 月前 • 190 次点击  
AI日报

5月15日•AIbase

1、阿里通义万相Wan2.1-VACE开源 号称首个开源的视频编辑统一模型

2、OpenAI 升级 ChatGPT:正式引入GPT-4.1 代码能力超强

3、Stability AI开源341M超轻量文字转语音模型,手机本地可跑,音频生成仅需8秒!

4、Poe 报告:可灵大模型视频生成量约占30%份额 领先Runway

5、微软 WizardLM 团队“集体跳槽”腾讯,或已并入混元大模型研发体系

6、腾讯宣布混元图像2.0将于5月16日全新发布

7、上海启动人工智能标识生态联盟,小红书和 MiniMax 等首批入盟

8、Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频,速度与质量双飞跃!

9、谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题,优化芯片与数据中心,训练速度飙升32.5%

10、腾讯元宝浏览器插件尝鲜版上线Chrome



1. 阿里通义万相Wan2.1-VACE开源 号称首个开源的视频编辑统一模型


通义万相宣布VACE开源,支持多种分辨率和任务,提供一站式视频创作体验,通过多模态输入机制实现高效灵活的视频编辑。


image.png


亮点提要:

✨ 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务,提高创作效率。。

🌟 强大的可控重绘能力,基于人体姿态、运动光流等控制生成,支持主体和背景参考。。

🔧 提出视频条件单元VCU,统一多模态输入,实现多任务自由组合与灵活编辑。。

详情入口:

🔗 https://github.com/Wan-Video/Wan2.1




2. OpenAI 升级 ChatGPT:正式引入GPT-4.1 代码能力超强


OpenAI发布了GPT-4.1及其轻量级版本GPT-4.1mini,显著增强了编码能力和指令执行体验,同时优化了用户体验和多模态支持,巩固了其在AI领域的领先地位。


亮点提要:

🚀 GPT-4.1具备强大的编码能力,处理复杂编程需求更高效,运行速度更快,是开发者和指令处理场景的理想选择。。

🌐 GPT-4.1mini轻量级且高效,在资源受限设备上仍能流畅运行,为免费和付费用户提供广泛访问渠道。。

🌟 ChatGPT新增多项功能如长按复制、表格复制和流式传输,界面优化显著提升用户体验。。




3.  Stability AI开源341M超轻量文字转语音模型,手机本地可跑,音频生成仅需8秒!


Stability AI发布了一款名为‘Adversarial Post-Training加速的快速文字转音频生成’的超轻量文字转语音模型,参数仅为341M,却能在H100 GPU上75毫秒生成12秒音频,在手机CPU上7秒完成同样任务,性能炸裂且多样性强。


亮点提要:

⚡️ARC后训练方法不基于蒸馏,提升模型生成速度与质量。。

📱模型轻量化设计,支持手机本地运行,大幅提升移动端创意应用体验。。

💫音频转音频功能实现风格迁移,激发更多创作灵感。。

详情入口:

🔗 https://arxiv.org/pdf/2505.08175




4. Poe 报告:可灵大模型视频生成量约占30%份额 领先Runway


近日发布的2025年春季AI模型使用趋势报告显示,中国快手的可灵多款视频生成模型在文生视频领域表现突出,市场份额达30%,其中可灵2.0模型仅三周就占21%使用比例。


亮点提要:

🌟 可灵大模型在文生视频领域市场份额达30%,领先Runway等竞争者。。

📈 可灵2.0模型自4月发布后三周内即占据21%视频生成市场。。

👥 可灵AI全球用户超2200万,月活跃用户增长25倍,生成视频与图片数量显著增加。。

详情入口:

🔗 https://www.chinaz.com/ainews/18086.shtml




5. 微软 WizardLM 团队“集体跳槽”腾讯,或已并入混元大模型研发体系


微软的人工智能研究团队 WizardLM 整体加入腾讯 AI 实验室的“混元”团队,标志着腾讯在大模型领域进一步发力。该团队不仅带来了多项技术突破,还通过开源模型展示了其研发实力。


亮点提要:

✨ 曾隶属于微软的 WizardLM 团队整体加入腾讯混元团队,强化了腾讯在大模型领域的竞争力。。

🚀 Hunyuan-TurboS0416 模型首次使用“混元”命名,象征着团队与腾讯的深度融合。。

💼 腾讯计划大幅增加 AI 投资,目标是在全球 AI 竞争中占据更为主导的地位。。




6. 腾讯宣布混元图像2.0将于5月16日全新发布


腾讯混元大模型团队宣布,混元图像2.0将在5月16日发布,这是腾讯在AI视觉领域的重要突破,以‘更智能、更开放、更中国’为核心理念。


image.png


亮点提要:

🌟 混元图像2.0将于5月16日发布,标志着腾讯在AI视觉领域的又一重要进展。。

🌐 新工具强调‘更智能、更开放、更中国’,助力创作者和企业迈向AI驱动的视觉生产新时代。。

🚀 继去年混元大模型升级后,腾讯再次展示其在人工智能领域的持续创新力。。




7. 上海启动人工智能标识生态联盟,小红书和 MiniMax 等首批入盟


本文介绍了上海市成立的人工智能标识生态联盟,该联盟旨在推动人工智能领域的标识技术发展,提高生成内容的透明度和安全性,并通过政策解读和企业合作,为构建可信的人工智能环境奠定基础。


亮点提要:

🌟 联盟由上海市委网信办指导,汇聚多家知名企业,目标是提升AI生成内容的透明度和安全性。。

🔍 国家互联网应急中心和中国电子技术标准化研究院解读相关政策,强调国际规则与中国特色的结合。。

🤝 小红书、MiniMax等企业参与标识工作实践,探索多种内容的标识方案并积累治理经验。。




8. Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频,速度与质量双飞跃!


以色列科技公司Lightricks发布的开源AI视频生成模型LTX-Video-13B精炼模型,以130亿参数为基础,结合多尺度渲染技术和高效量化优化,将视频生成速度提升至10秒以内,同时保持高质量输出。


亮点提要:

🚀 采用多尺度渲染技术,10秒内生成高清视频,速度提升5倍以上。。

🌍 开源模型,支持低显存设备运行,降低AI视频制作成本。。

🌟 生成速度提升30倍,媲美专业影视作品,重塑内容创作生态。。

详情 入口:

🔗 https://github.com/Lightricks/LTX-Video




9. 谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题,优化芯片与数据中心,训练速度飙升32.5%


谷歌DeepMind发布的AlphaEvolve是一款结合Gemini大语言模型与进化算法的AI编码代理,它在多个领域展现了强大的自优化能力,包括数据中心调度、芯片设计、AI训练以及数学研究。


亮点提要:

🌟 Gemini与进化算法结合,解决复杂问题如芯片优化和数学难题。。

🚀 AlphaEvolve优化数据中心调度,回收0.7%全球算力,节省运营成本。。

🔍 提升AI训练效率,Gemini模型训练速度提升32.5%,展现强大自我优化能力。。




10. 腾讯元宝浏览器插件尝鲜版上线Chrome


腾讯元宝浏览器插件尝鲜版上线Chrome平台,提供悬浮球、常驻侧边栏和划词工具栏等功能,提升网页浏览与信息处理效率。


image.png


亮点提要:

✨悬浮球功能支持一键翻译和总结网页内容,轻松跨越语言障碍并节省阅读时间。。

💬常驻侧边栏可高效答疑,支持截图提问,大幅提升信息获取效率。。

🔍划词工具栏实现选中文本后的即时搜索或翻译,让信息处理更流畅。。

详情入口:

🔗 https://yuanbao.tencent.com/download

           

点击阅读原文,进AIbase官网.


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182177