Py学习  »  aigc

微软Copilot将推出聊天记录置顶功能;OpenAI CEO发布2023年17条工作心得丨AIGC日报

创业邦 • 1 年前 • 319 次点击  

1.【微软Copilot将推出聊天记录置顶功能】12月22日消息,据Microsoft 365路线图今日更新,Copilot将提供新的置顶聊天记录功能,方便之后再次访问,最多可固定15条。该功能将于明年1月开始预览,2月开始正式推出。

2.【OpenAI CEO发布2023年17条工作心得】12月22日,OpenAI CEO萨姆·阿尔特曼(Sam Altman)在个人博客上发布了标题为《我希望有人告诉过我这些》(What I Wish Someone Had Told Me)的博客,提出17条商业建议,并称“希望这对那些在节日期间思考2024年要从事什么工作的人有所帮助”。阿尔特曼在文中提到:“乐观、执着、自信、强大的动力和人际关系是启动一切的关键。结果才是最重要的;不要让好的过程成为糟糕结果的借口。不要与商业物理定律作对。计划应以十年为单位,执行应以周为单位。”

3.【研究称Gemini Pro视觉能力与GPT-4V不相上下】12月22日消息,来自腾讯优图实验室、上海AI实验室、香港中文大学多媒体实验室等机构的团队发表128页的论文,对谷歌Gemini Pro的视觉理解能力进行测评并与OpenAI的GPT-4V比较,同时还与最新的开源MLLM Sphinx进行了比较,Sphinx显示了人工和黑盒系统之间的差距。测评涵盖了四个领域:基础感知、高级认知、挑战性视觉任务和各种专业能力。定性样本表明,虽然GPT-4V和Gemini展示了不同的回答风格和偏好,但它们在视觉推理能力上是可比较的,而Sphinx在领域泛化方面仍然落后于它们。具体来说,GPT-4V倾向于详细解释和中间步骤,而Gemini更喜欢输出直接而简洁的答案。

4.【智源开源新一代多模态基础模型Emu2】12月22日消息,据智源研究院微信公众号发文,昨日,智源研究院开源发布新一代多模态基础模型Emu2,通过大规模自回归生成式多模态预训练,显著推动多模态上下文学习能力的突破。Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型,在包括VQAv2、OKVQA、MSVD、MM-Vet、TouchStone在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。相较今年7月发布的第一代“多模态to多模态”Emu模型,Emu2使用了更简单的建模框架,训练了从编码器语义空间重建图像的解码器、并把模型规模化到37B参数实现模型能力和通用性上的突破。

5.【苹果购买新闻采集权训练AI】据报道,苹果公司已经和多家主要出版商达成协议,通过采集其相关新闻内容,以训练生成式AI系统。报告称苹果公司的目标,是和这些主要出版商达成多年合作协议,目前已经和康泰纳仕(Condé Nast)、NBC新闻和IAC接洽。报道称,拟议的交易金额至少5000万美元,如果该协议达成,苹果可以采集上述出版商的媒体内容,用于培训生成式AI。一些出版商对苹果的报价“不冷不热”;其他出版商对潜在的合作伙伴关系持“乐观态度”,并很高兴苹果主动要求使用他们的内容。

更多AIGC资讯……


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/166048