社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

AI最新资讯|阿里Qwen-2全球开源大模型排行榜第一、钉钉对所有大模型开放、ChatGPT Mac版开放,支持语音对话

科技每日推送 • 10 月前 • 213 次点击  


每日行业新闻

1、阿里Qwen-2成全球开源大模型排行榜第一

全球著名开源平台huggingface(笑脸)的联合创始人兼首席执行官Clem在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名。 

他使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。

结果显示,阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者。(来源:AIGC开放社区)

2、钉钉宣布对所有大模型开放,六家大模型接入钉钉

“Make 2024钉钉生态大会”上,钉钉宣布对所有大模型厂商开放,目标是构建中国最开放AI生态。除了通义大模型外,MiniMax、月之暗面、智谱AI、猎户星空、零一万物、百川智能六家大模型厂商已经与钉钉达成合作。

钉钉总裁叶军表示,模型开放是钉钉生态开放战略的再进一步。一方面,随着行业从模型创新走向应用创新,钉钉需要探索大模型的更多应用场景。钉钉拥有大量企业客户,数据优势与场景优势叠加,和大模型之间彼此需要。另一方面,钉钉上的大企业客户也对模型开放提出要求。(来源:第一财经)

3、ElevenLabs 推出 iOS 版 AI 文本转语音应用 ElevenLabs Reader App

AI语音初创公司 ElevenLabs 推出一款文本转语音应用 ElevenLabs Reader App,可以可让用户随时随地收听带有 ElevenLabs 语音的任何文本内容。

这会将用户的音频内容库扩展到手机上的任何文章、PDF、ePub、新闻稿或任何其他文本。该应用在前3个月免费试用,目前仅提供英文版本,计划未来扩展至29种语言。(来源:ElevenLabs官网)

4、OpenAI 的 ChatGPT Mac 版应用已向所有用户开放,支持语音对话

OpenAI 公司首款适用于 Mac 的 ChatGPT 聊天机器人应用正式面向所有用户开放下载。此前一个月,该应用一直处于测试阶段,仅 Plus 付费订阅用户可以使用。

OpenAI 称,ChatGPT 的 Mac 应用旨在与用户日常操作无缝集成,其原生支持 Mac 系统,并提供方便的快捷键 (Option + 空格键) 允许用户随时随地启动应用。

用户可以轻松与聊天机器人进行交互,并可选择将文件、照片和屏幕截图等附加到您的信息中,供 ChatGPT 使用这些素材进行理解和创作。(来源:IT之家)

5、Sora首部商业片亮相戛纳

用Sora制作的首部商业宣传片《玩具反斗城的起源》在戛纳国际创意节上的亮相。这部由导演Nik Kleverov使用OpenAI的Sora技术制作的影片,引起了近300万网友的关注和讨论。

这部商业片主要讲述了吉祥物长颈鹿杰弗瑞的起源故事以及创始人Charles Lazarus如何梦想出玩具反斗城。Sora在这部影片中展现了一致性,通过自然衔接的镜头传达了品牌的关键元素,如儿童梦幻色彩和吉祥物长颈鹿。

尽管影片获得了一些好评,但也有网友指出影片中存在一些不自然和不一致的地方,并对AI生成的商业视频提出了质疑。导演Nik Kleverov后来删除了相关推文。(来源:量子位)

6、谷歌推出创新方法:通过自然文本提示,快速训练视觉模型

谷歌和密苏里大学的研究人员推出了一种高效的视觉模型训练方法——Modeling Collaborator。

Modeling Collaborator主要包含大语言模型、图像描述生成模型和视觉问答模型,三种模型协同合作完成数据标注。

当用户输入一个概念名称和描述后,大语言模型会基于描述生成相关的原子问题,并将其提交给视觉问答模型获取答案。

再结合视觉问答模型的答复和图像描述生成模型的图像描述,通过思维链推理对输入图像进行标注。最后,用知识蒸馏的方式在大规模训练数据集上应用该方法,实现批量数据标准。(来源:AIGC开放社区)

7、旷视科技发布开源 AI 人像视频生成框架 MegActor

日前,旷视科技发布了一项新的开源 AI 人像视频生成框架——MegActor。

基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。MegActor 所生成的视频长度,取决于给定的驱动视频的长度。

与阿里 EMO、微软 VASA 等最新涌现的 AI 视频模型不同,旷视 MegActor 将采用开源的方式,提供给开发者社区使用。MegActor 能够呈现出丝毫毕现的效果,面部细节更加丰富自然,画质更出色。(来源:机器之心)

8、荣耀发布手机行业首个端侧 AI 反诈检测技术,可向用户发出风险提醒

上海世界移动通信大会(2024MWC 上海)期间,荣耀终端发布了手机行业首个端侧 AI 反诈检测技术。

据荣耀 CEO 赵明介绍,该技术能够自主识别用户视频通话中的画面要素。若检测到视频中存在 AI 换脸,将会向用户发出风险提醒。

同时,赵明演示了一个场景:一个年轻人的脸通过 DeepFake 实时被换脸成一个老人后,手机就会弹窗提示用户对方疑似 AI 换脸假冒身份。(来源:IT之家)

9、AI “早筛” 癌症,准确区分13种癌症,准确率98.2%

来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 98.2%。

据论文描述,该模型依赖于组织样本(而不是血液中的DNA 片段),目前还处于实验阶段,需要对更多样化的活检样本进行额外的训练和测试,方可进一步用于临床。

研究人员认为,这项研究的一个重要意义在于使用了一个可解释的人工智能模型,为其预测背后的逻辑提供了说明。该研究同时探索了他们的模型的内部工作原理,发现了该模型在理解致癌潜在过程方面有显著提升。(来源:学术头条)

每日投融资事件

1、人工智能初创公司Groq据悉在新一轮融资中估值25亿美元

多位知情人士透露,人工智能初创公司Groq将在贝莱德领投的新一轮融资中将估值翻番,达到25亿美元。

据The Information上月报道,Groq曾向摩根士丹利融资3亿美元。(来源:界面新闻)

- 完 -

欢迎关注老胡看AI,和您一起看AI

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/171690
 
213 次点击