Py学习  »  Git

10天暴涨20k Star!20岁大学生开源多Agent舆情分析神器登上GitHub热榜第一

智猩猩AI • 6 天前 • 181 次点击  

智猩猩AI整理

编辑:六一


一个为完成课程作业而生的项目,需要多久才能火遍GitHub?一位20岁大学生的答案是:十天。最近,这叫微舆(BettaFish)的开源项目在GitHub上火了,短短10来天,项目的Star数就从3k+ 涨到了27k,直线飙升(没错,真的是直线),甚至一度登上了GitHub热榜第一。



这是一个人人可用的多Agent舆情分析助手,目标是打破信息茧房,还原舆情原貌,甚至预测未来走向,帮助人们进行辅助决策。并且,这个项目是从0实现的,没有依赖任何框架,如果没有舆情分析的需求,用来学习Agent系统的搭建也非常不错。


  • 项目链接:

    https://github.com/666ghj/BettaFish


01

项目介绍


“微舆” 是一个从0实现的多智能体舆情分析系统,用户只需像聊天一样提出分析需求,智能体便开始全自动分析国内外30+主流社媒与数百万条大众评论。



比如让系统以“武汉大学舆情”为主题进行分析,只需输入主题,系统背后的Insight Agent(私有数据库挖掘)、Media Agent(多模态内容分析)、Query Agent(精准信息搜索)便开始协同工作,最终Report Agent收集所有信息并生成深度分析报告:


这里仅展示部分截图,感兴趣的朋友可以下载这个html文件,拖入浏览器进行查看:https://github.com/666ghj/BettaFish/blob/main/final_reports/final_report__20250827_131630.html


相比同类产品,微舆实现了:


  • AI驱动的全域监控AI爬虫集群7x24小时不间断作业,全面覆盖微博、小红书、抖音、快手等10+国内外关键社媒。不仅实时捕获热点内容,更能下钻至海量用户评论。


  • 超越LLM的复合分析引擎不仅依赖设计的5类专业Agent,更融合了微调模型、统计模型等中间件。通过多模型协同工作,确保了分析结果的深度、准度与多维视角。


  • 强大的多模态能力突破图文限制,能深度解析抖音、快手等短视频内容,并精准提取现代搜索引擎中的天气、日历、股票等结构化多模态信息卡片。


  • Agent“论坛”协作机制为不同Agent赋予独特的工具集与思维模式,引入辩论主持人模型,通过“论坛”机制进行链式思维碰撞与辩论。这不仅避免了单一模型的思维局限与交流导致的同质化,更催生出更高质量的集体智能与决策支持。


  • 公私域数据无缝融合平台不仅分析公开舆情,还提供高安全性的接口,支持用户将内部业务数据库与舆情数据无缝集成。为垂直业务提供“外部趋势+内部洞察”的强大分析能力。


  • 轻量化与高扩展性框架基于纯Python模块化设计,实现轻量化、一键式部署。代码结构清晰,开发者可轻松集成自定义模型与业务逻辑,实现平台的快速扩展与深度定制。


尽管功能如此强大,但“微舆”的目标,不止于舆情,而是成为驱动一切业务场景的简洁通用的数据分析引擎。举个例子,只需简单修改Agent工具集的api参数与prompt,就可以把它变成一个金融领域的市场分析系统。


02

如何使用


1、快速开始(Docker)


如果只想运行本项目,可以直接使用docker进行部署。


(1)启动项目


复制一份 .env.example 文件,命名为 .env ,并按需配置 .env 文件中的环境变量。


执行以下命令在后台启动所有服务:

docker compose up -d

注:镜像拉取速度慢,在原docker-compose.yml文件中,作者已经通过注释的方式提供了备用镜像地址以便替换。


(2)配置说明


数据库配置(PostgreSQL)


按照以下参数配置数据库连接信息,也支持Mysql,可自行修改:



大模型配置


所有LLM调用使用OpenAI的API接口标准。在完成数据库配置后,正常配置所有大模型相关的参数,确保系统能够连接到所选的大模型服务。


完成上述所有配置并保存后,系统即可正常运行。


2、源码启动指南


环境要求


操作系统: Windows、Linux、MacOS

Python版本: 3.9+

Conda: Anaconda或Miniconda

数据库: PostgreSQL(推荐)或MySQL

内存: 建议2GB以上


(1)创建环境


如果使用Conda:

# 创建conda环境conda create -n your_conda_name python=3.11conda activate your_conda_name

如果使用uv:

# 创建uv环境uv venv --python 3.11 # 创建3.11环境


    


(2)安装依赖包

# 基础依赖安装pip install -r requirements.txt
# uv版本命令(更快速安装)uv pip install -r requirements.txt# 如果不想使用本地情感分析模型(算力需求很小,默认安装cpu版本),可以将该文件中的“机器学习”部分注释掉再执行指令


(3)安装Playwright浏览器驱动

# 安装浏览器驱动(用于爬虫功能)playwright install chromium


(4)配置LLM与数据库


复制一份项目根目录 .env.example 文件,命名为 .env。


编辑 .env 文件,填入API密钥(也可以选择自己的模型、搜索智能体,详情见根目录.env.example文件内或根目录config.py中的说明)。


(5)启动系统


完整系统启动(推荐)

# 在项目根目录下,激活conda环境conda activate your_conda_name
# 启动主应用即可python app.py


uv 版本启动命令:

# 在项目根目录下,激活uv环境.venv\Scripts\activate
# 启动主应用即可python app.py

(开始时数据库为空,数据爬取需要单独操作,见下文。)


访问 http://localhost:5000 即可使用完整系统。


单独启动某个Agent

# 启动QueryEnginestreamlit run SingleEngineApp/query_engine_streamlit_app.py --server.port 8503
# 启动MediaEngine  streamlit run SingleEngineApp/media_engine_streamlit_app.py --server.port 8502
# 启动InsightEnginestreamlit run SingleEngineApp/insight_engine_streamlit_app.py --server.port 8501


爬虫系统单独使用


可参阅详细的配置文档:

https://github.com/666ghj/BettaFish/blob/main/MindSpider/README.md


MindSpider 运行示例

# 进入爬虫目录cd MindSpider
# 项目初始化python main.py --setup
# 运行话题提取(获取热点新闻和关键词)python main.py --broad-topic
# 运行完整爬虫流程python main.py --complete --date 2024-01-20
# 仅运行话题提取python main.py --broad-topic --date 2024-01-20
# 仅运行深度爬取python main.py --deep-sentiment --platforms xhs dy wb


如果你是初次学习一个Agent系统的搭建,可以从作者的另一个开源项目DeepSearchAgent-Demo开始,这是一个不依赖于任何框架的深度搜索AI智能体,能够通过多轮搜索和反思生成高质量的研究报告:https://github.com/666ghj/DeepSearchAgent-Demo。


03

写在最后


现在系统只完成了"三板斧"中的前两步,即从输入要求到详细分析,还缺少一步预测。



目前项目经过很长一段时间的爬取收集,拥有了大量全网话题热度随时间、爆点等的变化趋势热度数据,已经具备了可以开发预测模型的条件。未来,团队将实现真正基于数据驱动的舆情预测功能。



同时,项目作者在小红书上从项目发展、技术心得、产品营销、心态转变、现实收益等维度,全面复盘了微舆从课程作业成长到高星开源项目的全过程。他不仅介绍了AI编程、架构选型等实战经验,也坦诚剖析了作为独立开发者的迷茫与思考。但最重要的是,他用亲身经历证明了:这是一个属于独立创造者的好时代,关键在于找准方向,勇敢开始。


END


推荐阅读


14B小模型推理媲美DeepSeek-R1!微软提出全新RL方法,大海捞针准确率100%

清华唐杰教授团队新作!AgentRL框架所训模型性能超过GPT-5

GitHub狂揽32.7k Star!全网最全n8n智能体工作流开源,2053个工作流直接复用

超越字节DAPO!快手&清华提出强化学习方法ASPO,防止LLM过拟合和熵值塌陷

GitHub斩获70k Star!9000+实用MCP服务器大合集,让你告别重复造轮子


点击下方名片 即刻关注我们

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/189222