欢迎围观“AI新榜”的「AI日报」栏目。AIGC前沿资讯,及时拿捏!
📖 广电总局发布《数字虚拟人技术要求》:符合场景的任务设定、形象完好等
🤖 月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake
🚀 昆仑万维“天工大模型4.0”o1版启动邀测,具备中文逻辑推理能力
💡 360公司上线AI搜索产品“纳米搜索”App
📈 GPT-4o系列AI模型加持,微软LlamaParse文档解析能力全面升级
🔍 消息称亚马逊正开发视频AI模型,以减少对Anthropic的依赖
📱 Grok AI有望12月推独立App挑战ChatGPT
📲 摩托罗拉海外推出Moto AI首次公测,双击手机背部即可随时访问
👨💻 前谷歌Chrome工程师加入OpenAI
1. 广电总局发布《数字虚拟人技术要求》:符合场景的任务设定、形象完好等
11月28日,国家广播电视总局发布通知,国家广播电视总局组织审查了《数字虚拟人技术要求》,现批准为中华人民共和国广播电视和网络视听推荐性行业标准,予以发布。标准编号为GY / T 411-2024,该标准自发布之日起实施。
据《要求》,数字虚拟人主要应用场景分为内容播报、交互客服、虚拟演播和内容创作等。其中内容播报包含新闻资讯播报 / 手语播报、电影 / 电视 / 专题片 / 纪录片介绍和直播带货等;交互客服包含虚拟客服、智能助手和交互问答等;虚拟演播包含综艺主持、虚拟演唱会、文娱活动和用户代理虚拟分身等;内容创作包含影视创作、视频创作、广告创作和游戏创作等。
数字虚拟人形象,应满足如下要求:
符合场景的任务设定,在人物形象、表情、服饰等方面得体、美观;
支持全身、大半身、半身不同景别姿态;
形象完好,不存在扭曲、马赛克、跳帧、破损、音视频延时、口唇不一致等情况;
支持装扮、服饰的更换;
不存在侵犯第三方权利及法律法规禁止的其他情形。
数字虚拟人应用主体对其所处理的个人信息安全负责,满足如下要求:
处理个人信息应遵循合法、正当、必要和诚信原则,不应通过误导、欺诈、胁迫等方式处理个人信息;
处理个人信息应具有明确、合理的目的,并应与处理目的直接相关,采取对个人权益影响最小的方式;
处理个人信息前,应以显著方式、清晰易懂的语言真实、准确、完整地向个人告知个人信息的处理目的、方式、范围;
当对真实人脸、人声等生物识别信息进行编辑时,应告知被编辑的个人,并取得其单独同意。
2. 月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake
据悉,月之暗面Kimi和清华大学MADSys实验室于2024年6月联合发布了Kimi底层的Mooncake推理系统设计方案。该系统基于以KVCache为中心的PD分离和以存换算架构,提升了推理吞吐量。
近日,为了进一步加速该技术框架的应用与推广,月之暗面Kimi和清华大学MADSys实验室联合9#AISoft、阿里云、华为存储、面壁智能、趋境科技等共同发布开源项目Mooncake,共建以KVCache为中心的大模型推理架构。
11月28日,Mooncake技术框架已开源上线。据介绍,Mooncake开源项目从论文延伸,以超大规模KVCache缓存池为中心,通过以存换算的创新理念大幅度减少算力开销,提升了推理吞吐量。
本次开源将采用分阶段的方式,逐步开源高性能KVCache多级缓存Mooncake Store的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。其中传输引擎Transfer Engine部分现在已经在GitHub全球开源。Mooncake开源项目的最终目标是,为大模型时代打造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。
地址:https://github.com/kvcache-ai/Mooncake
3. 昆仑万维“天工大模型4.0”o1版启动邀测,具备中文逻辑推理能力
11月27日,昆仑万维集团宣布正式推出具有复杂思考推理能力的系列模型“天工大模型4.0”o1 版(Skywork o1)。
据介绍,Skywork o1是由昆仑万维集团发布的具有“慢思考推理能力”的系列模型,是国内第一款具备中文逻辑推理能力的o1模型。不同于现有的复现OpenAI o1模型的工作,Skywork o1不仅在模型输出上内生了思考、计划、反思等能力,在标准评测集上对比普通模型推理能力大幅上升,让模型拥有了思考和反思带来的推理能力的提升。
4. 360公司上线AI搜索产品“纳米搜索”App
近日,360集团研发的全新生成式 AI 搜索产品“纳米搜索” App已上架苹果App Store和应用宝等安卓应用商店,对标百度、阿里夸克、秘塔AI、Perplexity AI等多个AI搜索类产品。纳米搜索支持文字、语音、拍照、视频等多种搜索方式,同时,可以直接调用豆包、文心一言等16款大模型的能力,并配备数十款智能工具,用于写作、分析、翻译、旅游规划等场景。(来源:钛媒体)
5. GPT-4o系列AI模型加持,微软LlamaParse文档解析能力全面升级
近日,微软宣布在其LlamaParse中集成Azure OpenAI端点,利用GPT-4o系列模型,增强提取非结构化数据和解析多模态文档,并无缝衔接Azure AI Search向量数据库,构建完整的检索增强生成(RAG)工作流程。
据悉,微软LlamaParse是一个专为生成式人工智能(GenAI)设计的文档解析器,其主要目标是解析和清理各种文档数据,在传递给下游大型语言模型 (LLM) 之前,确保数据质量。
微软LlamaParse在本次集成后,可以让用户调用Azure OpenAI的GPT-4o系列模型,提取非结构化数据和文档转换。此次集成充分发挥了双方优势,LlamaParse 负责高效解析,Azure OpenAI则提供强大的语言模型能力,最终实现更精准、更智能的文档处理。(来源:IT之家)
6. 消息称亚马逊正开发视频AI模型,以减少对Anthropic的依赖
11月28日,据外媒报道,亚马逊开发了一套新的生成式AI模型,除文本外还能处理图像和视频,从而减少了对Anthropic的依赖。
据介绍,新模型代号为“奥林巴斯”(Olympus),将能够理解图像和视频中的场景,并通过简单的文字提示来搜索视频中的特定片段或场景,例如篮球比赛中的绝杀时刻。
它还可以利用AI模型制作“最美味的咖啡”或者“雨滴落到地面”,以及通过简单的文本提示实现更多功能,这可能会彻底改变客户与视觉数据的交互方式,使搜索更快、更直观、更具体。
知情人士透露,亚马逊最早将在下周举行的AWS re:Invent 技术大会上宣布有关这一模型的消息。值得一提的是,上周亚马逊宣布向Anthropic额外投资40亿美元,这使亚马逊对其的总投资额增至80亿美元。(来源:The Information)
7. Grok AI有望12月推独立App挑战ChatGPT
11月28日,据外媒报道,埃隆・马斯克(Elon Musk)旗下的xAI公司为加强和OpenAI公司的竞争,计划于12月为旗下Grok聊天机器人推出独立应用程序,以吸引更多用户。
据悉,包括OpenAI的ChatGPT、谷歌的Gemini以及Anthropic的Claude在内的竞争对手,普遍采用免费策略吸引更多的用户,而xAI公司的Grok应用现阶段仅限于X平台,且仅面向付费用户开放使用。(来源:The Verge)
8. 摩托罗拉海外推出Moto AI首次公测,双击手机背部即可随时访问
11月27日,摩托罗拉宣布启动Moto AI的全球开放测试计划,带来一系列创新AI功能。即日起,Motorola Razr 50 Ultra、Razr+、Razr 50及Edge 50 Ultra等设备的用户可通过系统通知注册测试计划,或访问motorola.com了解详情并完成报名。
用户只需双击设备背部,即可访问Moto AI的多项高级功能。
Catch me up(让我了解):不论用户多久未看手机,这项功能都能生成简洁的重要信息摘要。在做饭、聚会或享受无屏时间时,用户无需翻看堆积的通知,只需让Moto AI提供补充信息,便能轻松接续日程安排。
Pay attention(请注意):专为会议和对话设计的功能,让用户专注于交流本身。只需按下录音键,Moto AI即可记录、转录并总结要点,方便用户稍后回顾重要细节。
Remember this(记住它):Moto AI还可以成为用户的“数字备忘录”。每张照片或截图都将附加相关的背景信息和实用细节,并私密储存在个人日记中,方便用户随时查询。无论是航班安排还是购物清单,Moto AI都能随时调取需要的内容。
此外,Moto AI还带来了更智能的搜索栏,用户可快速查找应用、联系人、新闻及系统设置。全新设计的搜索界面分为Apps、News和Journal三个直观标签页,同时支持自然语言的语音和文本搜索,让用户轻松获取即时答案或完成操作。例如,利用智能动作功能,只需一条语音指令即可完成自拍或扫描文档等任务。(来源:IT之家)
9. 前谷歌Chrome工程师加入OpenAI
近日,前谷歌Chrome浏览器工程师Darin Fisher加入了OpenAI。此前有外媒报道称,OpenAI考虑通过自行推出一款基于AI聊天机器人的自研浏览器,与谷歌形成“正面冲突”。
报道称,Darin Fisher曾为Google Chrome、Mozilla Firefox和Neeva作出重要贡献。在其领导下,Chrome推出了多进程架构等功能,打造了以“简洁至上”为核心的用户界面。他带领团队坚持“简单、快速、安全、稳定”的四项原则,奠定了Chrome的技术优势。同时,其坚持基于各操作系统本地开发,尽管短期内增加了工作量,但让Chrome能够在Windows、Mac和Linux等平台上表现出色。(来源:综合消息)
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。