Py学习  »  aigc

AI视频理解模型MiniGPT4-Video发布;通义千问开源320亿参数模型;Meta修改深度伪造内容管理规则丨AIGC日报

创业邦 • 1 月前 • 96 次点击  


1.【AI视频理解模型MiniGPT4-Video发布】根据arXiv网站,KAUST和哈佛大学研究团队在4月4日发表的论文中提出MiniGPT4-Video框架,一个专为视频理解而设计的多模态大模型。该模型能够处理时间视觉和文本数据,使其能够熟练地理解视频的复杂性。MiniGPT4-video不仅考虑视觉内容,还集成了文本对话,允许模型有效地回答涉及视觉和文本组件的查询。据称,该模型优于现有的最先进的方法,在MSVD、MSRVTT、TGIF和TVQA基准测试上分别获得4.22%、1.13%、20.82%和13.1%的成绩,模型和代码已公开。

2.【中国人形机器人生态联合体在上海智能谷成立】4月7日消息,在近日举行的2024中国人形机器人生态大会上,中国人形机器人生态联合体正式成立,中国人形机器人产业发展白皮书正式发布,爱仕达人形机器人应用创新研究院正式揭牌。据悉,中国人形机器人生态联合体由中国机电一体化技术应用协会智能机器人分会牵头成立。“中国人形机器人产业发展白皮书”则由中国机电一体化技术应用协会联合开源证券编撰。

3.【Meta修改深度伪造内容管理规则】据路透社4月5日报道,Meta周五宣布修改相关数字媒体政策,准备测试其监管AI技术生成的欺骗性内容的能力。新方法将改变公司对操纵内容的处理方式,从专注于删除特定帖子转向保持内容不变,同时向观众提供有关其制作方式的信息。

4.【报告称OpenAI采集了超一百万小时的YouTube视频来训练GPT-4】报道称,OpenAI迫切需要训练数据,并开发了 Whisper音频转录模型来克服困难,转录了超过100万小时的YouTube 视频来训练其最先进的大型语言模型GPT-4。

5.【通义千问开源320亿参数模型】4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。 通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本。


更多AIGC资讯……



欢迎订阅AIGC产业日报,精选行业新闻,帮你省时间!👇



AIGC社群邀您加入



点赞、在看点这里

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/168796
 
96 次点击