社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

360公司上线AI搜索产品“纳米搜索”;Grok AI有望12月推独立App挑战ChatGPT | AI日报

AI新榜 • 4 天前 • 23 次点击  
 欢迎围观“AI新榜”的「AI日报」栏目。AIGC前沿资讯,及时拿捏!

【1分钟速看版】


📖 广电总局发布《数字虚拟人技术要求》:符合场景的任务设定、形象完好等

🤖 月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake

🚀 昆仑万维“天工大模型4.0”o1版启动邀测,具备中文逻辑推理能力

💡 360公司上线AI搜索产品“纳米搜索”App

📈 GPT-4o系列AI模型加持,微软LlamaParse文档解析能力全面升级

🔍 消息称亚马逊正开发视频AI模型,以减少对Anthropic的依赖

📱 Grok AI有望12月推独立App挑战ChatGPT

📲 摩托罗拉海外推出Moto AI首次公测,双击手机背部即可随时访问

👨‍💻 前谷歌Chrome工程师加入OpenAI


国内资讯


1. 广电总局发布《数字虚拟人技术要求》:符合场景的任务设定、形象完好等


11月28日,国家广播电视总局发布通知,国家广播电视总局组织审查了《数字虚拟人技术要求》,现批准为中华人民共和国广播电视和网络视听推荐性行业标准,予以发布。标准编号为GY / T 411-2024,该标准自发布之日起实施。


据《要求》,数字虚拟人主要应用场景分为内容播报、交互客服、虚拟演播和内容创作等。其中内容播报包含新闻资讯播报 / 手语播报、电影 / 电视 / 专题片 / 纪录片介绍和直播带货等;交互客服包含虚拟客服、智能助手和交互问答等;虚拟演播包含综艺主持、虚拟演唱会、文娱活动和用户代理虚拟分身等;内容创作包含影视创作、视频创作、广告创作和游戏创作等。


数字虚拟人形象,应满足如下要求:


符合场景的任务设定,在人物形象、表情、服饰等方面得体、美观;


支持全身、大半身、半身不同景别姿态;


形象完好,不存在扭曲、马赛克、跳帧、破损、音视频延时、口唇不一致等情况;


支持装扮、服饰的更换;


不存在侵犯第三方权利及法律法规禁止的其他情形。


数字虚拟人应用主体对其所处理的个人信息安全负责,满足如下要求:


处理个人信息应遵循合法、正当、必要和诚信原则,不应通过误导、欺诈、胁迫等方式处理个人信息; 


处理个人信息应具有明确、合理的目的,并应与处理目的直接相关,采取对个人权益影响最小的方式; 


处理个人信息前,应以显著方式、清晰易懂的语言真实、准确、完整地向个人告知个人信息的处理目的、方式、范围; 


当对真实人脸、人声等生物识别信息进行编辑时,应告知被编辑的个人,并取得其单独同意。


2. 月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake


据悉,月之暗面Kimi和清华大学MADSys实验室于2024年6月联合发布了Kimi底层的Mooncake推理系统设计方案。该系统基于以KVCache为中心的PD分离和以存换算架构,提升了推理吞吐量。



近日,为了进一步加速该技术框架的应用与推广,月之暗面Kimi和清华大学MADSys实验室联合9#AISoft、阿里云、华为存储、面壁智能、趋境科技等共同发布开源项目Mooncake,共建以KVCache为中心的大模型推理架构。


11月28日,Mooncake技术框架已开源上线。据介绍,Mooncake开源项目从论文延伸,以超大规模KVCache缓存池为中心,通过以存换算的创新理念大幅度减少算力开销,提升了推理吞吐量。


本次开源将采用分阶段的方式,逐步开源高性能KVCache多级缓存Mooncake Store的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。其中传输引擎Transfer Engine部分现在已经在GitHub全球开源。Mooncake开源项目的最终目标是,为大模型时代打造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。


地址:https://github.com/kvcache-ai/Mooncake


3. 昆仑万维“天工大模型4.0”o1版启动邀测,具备中文逻辑推理能力


11月27日,昆仑万维集团宣布正式推出具有复杂思考推理能力的系列模型“天工大模型4.0”o1 版(Skywork o1)。


据介绍,Skywork o1是由昆仑万维集团发布的具有“慢思考推理能力”的系列模型,是国内第一款具备中文逻辑推理能力的o1模型。不同于现有的复现OpenAI o1模型的工作,Skywork o1不仅在模型输出上内生了思考、计划、反思等能力,在标准评测集上对比普通模型推理能力大幅上升,让模型拥有了思考和反思带来的推理能力的提升。


4. 360公司上线AI搜索产品“纳米搜索”App


近日,360集团研发的全新生成式 AI 搜索产品“纳米搜索” App已上架苹果App Store和应用宝等安卓应用商店,对标百度、阿里夸克、秘塔AI、Perplexity AI等多个AI搜索类产品。


纳米搜索支持文字、语音、拍照、视频等多种搜索方式,同时,可以直接调用豆包、文心一言等16款大模型的能力,并配备数十款智能工具,用于写作、分析、翻译、旅游规划等场景。(来源:钛媒体)


海外资讯


5. GPT-4o系列AI模型加持,微软LlamaParse文档解析能力全面升级


近日,微软宣布在其LlamaParse中集成Azure OpenAI端点,利用GPT-4o系列模型,增强提取非结构化数据和解析多模态文档,并无缝衔接Azure AI Search向量数据库,构建完整的检索增强生成(RAG)工作流程。



据悉,微软LlamaParse是一个专为生成式人工智能(GenAI)设计的文档解析器,其主要目标是解析和清理各种文档数据,在传递给下游大型语言模型 (LLM) 之前,确保数据质量。


微软LlamaParse在本次集成后,可以让用户调用Azure OpenAI的GPT-4o系列模型,提取非结构化数据和文档转换。此次集成充分发挥了双方优势,LlamaParse 负责高效解析,Azure OpenAI则提供强大的语言模型能力,最终实现更精准、更智能的文档处理。(来源:IT之家)


6. 消息称亚马逊正开发视频AI模型,以减少对Anthropic的依赖


11月28日,据外媒报道,亚马逊开发了一套新的生成式AI模型,除文本外还能处理图像和视频,从而减少了对Anthropic的依赖。


据介绍,新模型代号为“奥林巴斯”(Olympus),将能够理解图像和视频中的场景,并通过简单的文字提示来搜索视频中的特定片段或场景,例如篮球比赛中的绝杀时刻。


它还可以利用AI模型制作“最美味的咖啡”或者“雨滴落到地面”,以及通过简单的文本提示实现更多功能,这可能会彻底改变客户与视觉数据的交互方式,使搜索更快、更直观、更具体。


知情人士透露,亚马逊最早将在下周举行的AWS re:Invent 技术大会上宣布有关这一模型的消息。值得一提的是,上周亚马逊宣布向Anthropic额外投资40亿美元,这使亚马逊对其的总投资额增至80亿美元。(来源:The Information)


7. Grok AI有望12月推独立App挑战ChatGPT


11月28日,据外媒报道,埃隆・马斯克(Elon Musk)旗下的xAI公司为加强和OpenAI公司的竞争,计划于12月为旗下Grok聊天机器人推出独立应用程序,以吸引更多用户。



据悉,包括OpenAI的ChatGPT、谷歌的Gemini以及Anthropic的Claude在内的竞争对手,普遍采用免费策略吸引更多的用户,而xAI公司的Grok应用现阶段仅限于X平台,且仅面向付费用户开放使用。(来源:The Verge


8. 摩托罗拉海外推出Moto AI首次公测,双击手机背部即可随时访问


11月27日,摩托罗拉宣布启动Moto AI的全球开放测试计划,带来一系列创新AI功能。即日起,Motorola Razr 50 Ultra、Razr+、Razr 50及Edge 50 Ultra等设备的用户可通过系统通知注册测试计划,或访问motorola.com了解详情并完成报名。


用户只需双击设备背部,即可访问Moto AI的多项高级功能。



Catch me up(让我了解):不论用户多久未看手机,这项功能都能生成简洁的重要信息摘要。在做饭、聚会或享受无屏时间时,用户无需翻看堆积的通知,只需让Moto AI提供补充信息,便能轻松接续日程安排。


Pay attention(请注意):专为会议和对话设计的功能,让用户专注于交流本身。只需按下录音键,Moto AI即可记录、转录并总结要点,方便用户稍后回顾重要细节。


Remember this(记住它):Moto AI还可以成为用户的“数字备忘录”。每张照片或截图都将附加相关的背景信息和实用细节,并私密储存在个人日记中,方便用户随时查询。无论是航班安排还是购物清单,Moto AI都能随时调取需要的内容。


此外,Moto AI还带来了更智能的搜索栏,用户可快速查找应用、联系人、新闻及系统设置。全新设计的搜索界面分为Apps、News和Journal三个直观标签页,同时支持自然语言的语音和文本搜索,让用户轻松获取即时答案或完成操作。例如,利用智能动作功能,只需一条语音指令即可完成自拍或扫描文档等任务。(来源:IT之家)


9. 前谷歌Chrome工程师加入OpenAI


近日,前谷歌Chrome浏览器工程师Darin Fisher加入了OpenAI。此前有外媒报道称,OpenAI考虑通过自行推出一款基于AI聊天机器人的自研浏览器,与谷歌形成“正面冲突”。


报道称,Darin Fisher曾为Google Chrome、Mozilla Firefox和Neeva作出重要贡献。在其领导下,Chrome推出了多进程架构等功能,打造了以“简洁至上”为核心的用户界面。他带领团队坚持“简单、快速、安全、稳定”的四项原则,奠定了Chrome的技术优势。同时,其坚持基于各操作系统本地开发,尽管短期内增加了工作量,但让Chrome能够在Windows、Mac和Linux等平台上表现出色。(来源:综合消息)


(整理:Kino)

AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。

欢迎分享、点赞、在看
 一起研究AI

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176367
 
23 次点击