微软Copilot将推出聊天记录置顶功能；OpenAI CEO发布2023年17条工作心得丨AIGC日报

1.【微软Copilot将推出聊天记录置顶功能】12月22日消息，据Microsoft 365路线图今日更新，Copilot将提供新的置顶聊天记录功能，方便之后再次访问，最多可固定15条。该功能将于明年1月开始预览，2月开始正式推出。

2.【OpenAI CEO发布2023年17条工作心得】12月22日，OpenAI CEO萨姆·阿尔特曼（Sam Altman）在个人博客上发布了标题为《我希望有人告诉过我这些》（What I Wish Someone Had Told Me）的博客，提出17条商业建议，并称“希望这对那些在节日期间思考2024年要从事什么工作的人有所帮助”。阿尔特曼在文中提到：“乐观、执着、自信、强大的动力和人际关系是启动一切的关键。结果才是最重要的；不要让好的过程成为糟糕结果的借口。不要与商业物理定律作对。计划应以十年为单位，执行应以周为单位。”

3.【研究称Gemini Pro视觉能力与GPT-4V不相上下】12月22日消息，来自腾讯优图实验室、上海AI实验室、香港中文大学多媒体实验室等机构的团队发表128页的论文，对谷歌Gemini Pro的视觉理解能力进行测评并与OpenAI的GPT-4V比较，同时还与最新的开源MLLM Sphinx进行了比较，Sphinx显示了人工和黑盒系统之间的差距。测评涵盖了四个领域：基础感知、高级认知、挑战性视觉任务和各种专业能力。定性样本表明，虽然GPT-4V和Gemini展示了不同的回答风格和偏好，但它们在视觉推理能力上是可比较的，而Sphinx在领域泛化方面仍然落后于它们。具体来说，GPT-4V倾向于详细解释和中间步骤，而Gemini更喜欢输出直接而简洁的答案。

4.【智源开源新一代多模态基础模型Emu2】12月22日消息，据智源研究院微信公众号发文，昨日，智源研究院开源发布新一代多模态基础模型Emu2，通过大规模自回归生成式多模态预训练，显著推动多模态上下文学习能力的突破。Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型，在包括VQAv2、OKVQA、MSVD、MM-Vet、TouchStone在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。相较今年7月发布的第一代“多模态to多模态”Emu模型，Emu2使用了更简单的建模框架，训练了从编码器语义空间重建图像的解码器、并把模型规模化到37B参数实现模型能力和通用性上的突破。

5.【苹果购买新闻采集权训练AI】据报道，苹果公司已经和多家主要出版商达成协议，通过采集其相关新闻内容，以训练生成式AI系统。报告称苹果公司的目标，是和这些主要出版商达成多年合作协议，目前已经和康泰纳仕（Condé Nast）、NBC新闻和IAC接洽。报道称，拟议的交易金额至少5000万美元，如果该协议达成，苹果可以采集上述出版商的媒体内容，用于培训生成式AI。一些出版商对苹果的报价“不冷不热”；其他出版商对潜在的合作伙伴关系持“乐观态度”，并很高兴苹果主动要求使用他们的内容。

更多AIGC资讯……