社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

AIGC开放社区 • 5 天前 • 213 次点击  
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

相信有不少小伙伴正在学习AI AgentMCPRAG的开发和商业用例吧。虽然GithubHugging Face有海量开源项目,但想找出经典又实用的并不容易。

所以,「AIGC开放社区」就为大家介绍一个精选的开源大合集,包括入门级AI Agent、高级Agent、多层级智能体、语音智能体、多类型RAG等非常好用的项目。不仅适合新手,开发老鸟也可以学习借鉴下启发灵感。

目前,这个合集在Github已经超过58000颗星,并且拿下过Github每日最佳趋势第一名。不用担心质量,已经过超过10万开发者的认证了。

开源地址:https://github.com/Shubhamsaboo/awesome-llm-apps/?tab=readme-ov-file

下面就为大家简单的介绍这个开源库的主要内容。

入门级AI Agent

这些智能体是为初学者设计的,功能较为基础,易于理解和上手。涵盖了多种常见的应用场景。例如,将博客内容转换为播客智能体,能够提取博客中的关键信息,生成适合音频传播的脚本,并结合语音合成技术将文字转化为自然流畅的音频内容,让用户可以通过听觉方式获取博客信息,丰富内容的传播形式。

医疗影像智能体,具备对医学影像如 X 光、 CT 扫描、核磁共振等的识别和解读能力,能够辅助医疗人员更准确地判断影像中的异常情况,为疾病的诊断提供支持。

浏览器智能体,结合了多个大模型的能力和自动化浏览器交互,通过直接操作网站,根据文本提示生成meme

音乐智能体,可以根据用户的需求,如音乐风格、节奏、情绪等,生成原创的音乐作品。集成了音乐理论知识和生成模型,能够创作旋律、和声甚至编曲,为音乐爱好者、创作者提供灵感和创作辅助,降低音乐创作的入门难度。

高级AI Agent

高级AI Agent是面向更繁琐、跨平台、业务流程的智能体,通常需要结合多模型协作或领域知识,以解决高精度、复杂度的自动化需求。

例如,AI系统架构师智能体会调用 DeepSeek+ Claude双模型,分析系统架构的安全性、可扩展性,覆盖医疗数据平台、实时事件处理系统等专业场景。

AI深度研究智能体能自动爬取学术论文、行业报告,整合量子计算、可再生能源等前沿领域信息,生成结构化研究结论。

实时商业策略顾问智能体,基于 Google ADK的框架,同时集成了Perplexity AI搜索工具,实时获取最新行业动态、竞品数据及政策变化。

个性化财务规划智能体,整合YFinance等实时金融数据接口。能分析用户收入结构与支出习惯,针对购房、养老等需求制定分阶段储蓄投资方案,并结合风险承受能力推荐低、中、高风险金融产品组合。

电影制作智能体,可评估剧本的情节逻辑与市场适配性,拆分拍摄、后期等环节的预算,建议导演、演员等团队配置,规划避开竞品的档期,通过数据分析降低制作风险、优化资源分配。

商业投资智能体,整合市场历史数据、实时行情及宏观经济指标,通过 AI 模型预测资产价格趋势,推荐股票、基金等投资标的并附风险评级,支持自定义短期投机或长期价值投资周期,输出可视化收益预期与止损建议。

健康管理智能体,基于用户体重、体脂率等身体数据及增肌、减脂等目标,生成定制化方案:包括分日、周的运动类型、强度安排,热量摄入与营养素配比的饮食建议。

产品发布智能体,采用 Firecrawl异步爬取数据,Agno Team负责多智能体协作,Streamlit 提供交互UI 。能抓取竞品功能与用户评价以识别市场空白,建议发布时间、渠道组合及促销方案,还能预测用户反馈等风险并提供应对措施。

基于MCPAI Agent

这些是基于MCP服务的智能体,能够同时处理多个上下文信息,提供更加智能和灵活的服务。

例如,浏览器MCP Agent,是一款基于Streamlit的应用,核心功能是允许用户通过自然语言命令浏览和交互网站。

支持全浏览器导航,包括访问网站、页面跳转,还能与页面元素交互,如点击按钮、填写表单、滚动内容,同时提供视觉反馈网页元素截图和信息提取能力,可从网页中提取并总结内容并完成多步骤浏览任务,如 “进入博客找到最新文章并总结要点

GitHub MCP智能体,可实时对对Github开源库进行全面分析。涵盖查询仓库的 issues、拉取请求、活动记录和代码统计等。同时提供用户友好的界面,包含示例查询和自定义输入选项,能实时返回仓库活动等。

Notion MCP智能体是一款终端- based工具,能帮助用户通过自然语言与 Notion 页面交互,依托 Notion MCP 服务器实现对 Notion 内容的操作。它支持多种页面交互功能,包括更新、插入、检索内容,创建和编辑块、列表、表格等 Notion 结构,添加评论,搜索特定信息,且能记住对话上下文以支持多轮交互,同时提供会话管理确保对话的持久性。

多类型RAG

RAG作为大模型必备功能之一,通过检索大量数据来增强生成内容的准确性和相关性。这种强大的能力同样可以应用在AI Agent领域。

Agentic RAG 是一款基于GPT-4o构建的检索增强生成系统,核心在于整合 PDF 知识库与 DuckDuckGo网页搜索能力,采用 LanceDB作为向量数据库实现高效的相似性检索,并提供直观的交互界面,让用户能便捷地与结合文档知识和网络信息的AI助手互动,仅需 15 Python 代码即可实现基础功能。

Agentic RAG with Reasoning则更强调推理过程的透明度,结合Claude 3.5进行语言处理和OpenAI嵌入模型实现向量搜索,支持文档上传与 URL 动态添加,通过 LanceDB 实现向量数据的持久化存储。

其主要技术特点是实时展示智能体的思考步骤,采用左右分栏视图呈现推理过程与最终答案,同时清晰标注信息来源,让用户能直观了解RAG流程的每一步,从文档加载、文本分块、嵌入生成到检索匹配的全链路都可追溯。

博客RAG,专注于 AI 领域博客内容的精准检索,基于LangChainLangGraph构建,集成Google Gemini 模型处理查询与生成结果,以Qdrant作为向量数据库存储博客内容嵌入。

具备智能查询处理能力,能判断查询是否需要重写、直接回答或进一步检索,还通过 Gemini 模型实现相关性自动评估,优化检索结果。

Hybrid搜索RAG,主要提供混合搜索能力融合语义匹配与关键词检索提升文档召回率,支持 PDF 文档上传处理,自动完成文本分块与嵌入,当文档信息不足时会调用 Claude 的通用知识补充,通过 Streamlit 提供直观的聊天界面,平衡了文档特定知识与通用智能的优势。

RAG-as-a-Service偏向于将RAG能力封装为服务,便于集成到各类应用中,提供标准化的文档处理、检索与生成接口,降低开发者构建RAG系统的门槛,包含向量存储管理、模型调用、检索优化等核心功能,支持按需扩展以应对不同规模的知识处理需求。

数据库RAG具备智能查询路由能力,通过Agno智能体将用户查询分发到最相关的专业数据库包括产品信息、客户支持与 FAQ 、财务信息三类,采用 Langchain 编排 RAG 流程,Qdrant 管理各数据库的文档嵌入。

当数据库中无相关信息时,触发LangGraph智能体调用DuckDuckGo进行网页搜索作为 fallback。支持多 PDF 上传分类存储,并通过Streamlit界面实现自然语言查询交互,确保查询能精准匹配到最相关的知识源。

上面只是介绍了一小部分,目前这个开源库仍在持续更新,估计以后还会加入更多好用的智能体和相关的技术。

END

点击图片立即报名👇️

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/185692
 
213 次点击