Py学习  »  Git

GitHub 1.1万星,模拟软件开发流程,开源框架MetaGPT爆火

FightingCV • 9 月前 • 126 次点击  

关注“FightingCV”公众号

回复“AI”即可获得超100G人工智能的教程

点击进入→ FightingCV交流群
在不久的将来,我们应该就能用上智能体开发的软件了。

随着大型语言模型(LLM)的日渐成熟,利用其构建 AI 智能体成为一个新的研究方向。已有研究使用 LLM 驱动多智能体自主完成了一些任务。


然而,现有研究主要集中在简单任务上,缺乏对复杂任务的探索。这主要是因为大型语言模型存在「幻觉」问题,特别是当多个智能体相互作用时,幻觉会进一步被放大,以至于无法用于复杂任务。


最近,一个名为「MetaGPT」的开源框架尝试解决这个问题。MetaGPT 旨在将有效的人类工作流程作为元编程方法注入到 LLM 驱动的多智能体协作中。MetaGPT 在 GitHub 上线几天,就狂揽超过 11.1k star。



项目地址:https://github.com/geekan/MetaGPT


简单来说,MetaGPT 让多智能体的协作过程模拟软件开发公司的工作流程,这就需要为每个智能体分配角色,并规划智能体的协作过程。软件开发公司的人员分配情况通常如下图所示:



具体来说,MetaGPT 首先将标准化操作程序 (SOP) 编码到 prompt 中,使得多个智能体的协作过程结构化。然后,研究团队进一步让输出模块化,赋予智能体与人类工作者相当的领域专业知识,以验证输出并减少复合错误。


通过这种方式,MetaGPT 以工作流水线的形式为各个智能体分配了不同的角色,进而建立了一个能够有效、凝聚地解构复杂多智能体协作问题的框架。



对于软件开发来说,系统架构和接口设计是非常关键的一步,研究团队以推荐引擎开发为例,展示了 MetaGPT 中的「架构师智能体」自主生成的系统接口设计:



MetaGPT 可以让智能体完成多种复杂任务,例如开发一个简单的游戏软件,MetaGPT 的任务执行流程可以和人类开发者的 SOP 流程一一对应:



MetaGPT 会收到用户输入的需求,就会有智能体作为产品经理进行需求和可行性分析,再由充当架构师、项目经理、工程师的智能体按顺序完成软件开发。最后还有智能体负责对软件进行全面的测试。整个过程很好地模拟了现实世界的开发过程。



我们来看一个 MetaGPT 完成具体开发任务的例子,用户只输入一句需求:写一个 「21 点游戏(Blackjack)」,MetaGPT 就经过需求分析、任务规划,成功编写出游戏代码:





,时长01:06




研究团队在项目路线图中介绍道:MetaGPT 短期内将完成自主实现中型项目(约 2000 行代码)的目标,最终 MetaGPT 将能够自主训练、微调、优化、应用和更新。



目前,MetaGPT 已发表研究论文《METAGPT: META PROGRAMMING FOR MULTI-AGENT COLLABORATIVE FRAMEWORK》。



论文地址:https://arxiv.org/pdf/2308.00352.pdf


感兴趣的读者可以阅读论文,了解更多研究内容。


往期回顾


基础知识

【CV知识点汇总与解析】|损失函数篇

【CV知识点汇总与解析】|激活函数篇

【CV知识点汇总与解析】| optimizer和学习率篇

【CV知识点汇总与解析】| 正则化篇

【CV知识点汇总与解析】| 参数初始化篇

【CV知识点汇总与解析】| 卷积和池化篇 (超多图警告)

【CV知识点汇总与解析】| 技术发展篇 (超详细!!!)


最新论文解析

NeurIPS2022 Spotlight | TANGO:一种基于光照分解实现逼真稳健的文本驱动3D风格化

ECCV2022 Oral | 微软提出UNICORN,统一文本生成与边框预测任务

NeurIPS 2022 | VideoMAE:南大&腾讯联合提出第一个视频版MAE框架,遮盖率达到90%

NeurIPS 2022 | 清华大学提出OrdinalCLIP,基于序数提示学习的语言引导有序回归

SlowFast Network:用于计算机视觉视频理解的双模CNN

WACV2022 | 一张图片只值五句话吗?UAB提出图像-文本匹配语义的新视角!

CVPR2022 | Attention机制是为了找最相关的item?中科大团队反其道而行之!

ECCV2022 Oral | SeqTR:一个简单而通用的 Visual Grounding网络

如何训练用于图像检索的Vision Transformer?Facebook研究员解决了这个问题!

ICLR22 Workshop | 用两个模型解决一个任务,意大利学者提出维基百科上的高效检索模型

See Finer, See More!腾讯&上交提出IVT,越看越精细,进行精细全面的跨模态对比!

MM2022|兼具低级和高级表征,百度提出利用显式高级语义增强视频文本检索

MM2022 | 用StyleGAN进行数据增强,真的太好用了

MM2022 | 在特征空间中的多模态数据增强方法

ECCV2022|港中文MM Lab证明Frozen的CLIP 模型是高效视频学习者

ECCV2022|只能11%的参数就能优于Swin,微软提出快速预训练蒸馏方法TinyViT

CVPR2022|比VinVL快一万倍!人大提出交互协同的双流视觉语言预训练模型COTS,又快又好!

CVPR2022 Oral|通过多尺度token聚合分流自注意力,代码已开源

CVPR Oral | 谷歌&斯坦福(李飞飞组)提出TIRG,用组合的文本和图像来进行图像检索


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/160206
 
126 次点击