32 个 Agent 组队写论文！这个 GitHub 6000 星项目，把科研苦力全包了

一套开源技能包，4 个模块，32 个 AI Agent 协同工作。

你的 Claude Code 秒变论文写作流水线。从选题、文献检索、写作、同行评审到定稿，科研全链路覆盖。

2 个多月，GitHub 超 6000 星。

这个项目叫 Academic Research Skills（地址 https://github.com/Imbad0202/academic-research-skills），作者是独立开发者吴政宜（Cheng-I Wu）。最近登上了 Hacker News 首页。

网上打着「学术写作」旗号的项目一抓一大把。提示词仓库、论文模板、文献管理脚本。

这个项目不太一样。它是一条完整的科研生产线。

10 个阶段，从研究到论文发表，每个阶段有专门的 Agent 负责。阶段之间有质量控制，有交接协议，有物料护照（Material Passport）记录每一步的数据流向。

如果学术提示词是给你一把锤子，这个项目是给你建了一座工厂。

拆开来看， Academic Research Skills 有四个核心模块。

Deep Research 负责调研。13 个 Agent，支持全面检索、快速概述、系统综述、苏格拉底引导式研究等 7 种模式。你告诉它研究方向，它用苏格拉底式提问帮你理清思路，不直接给答案，逼你自己想明白。

Academic Paper 负责写作。12 个 Agent，支持全文写作、大纲规划、修订指导、摘要生成等 10 种模式。它还有一个风格校准功能，你投喂 3 篇以前写的论文，它学习你的写作风格，后面写稿时模仿你的句式节奏和用词偏好。

Academic Paper Reviewer 负责审稿。7 个 Agent，模拟真实的同行评审。一个主编、三个审稿人再加一个专门唱反调的，5 人委员会各自打分，给出 0-100 分的质量评估。80 分以上接收，50 分以下拒稿。还有一个校准模式，你可以用自己的标注数据去测试审稿人的假阴性率和假阳性率。

Academic Pipeline 是总调度。把前面三个模块串成 10 个阶段的流水线。第 2.5 阶段和第 4.5 阶段是强制完整性门控，不能跳过，专门检查引用造假、数据编造、方法论虚构。

划重点，README 里有这么一段话。

「AI is your copilot, not the pilot. This tool won't write your paper for you.」

AI 是你的副驾驶，不是主驾。这个工具不会帮你写论文。

它处理的是苦力活。找文献、格式化引用、核查数据、检测逻辑漏洞。你负责定义问题、选择方法、解读数据、写出「I argue that」后面那句话。

它不帮你隐藏使用 AI 的痕迹。恰恰相反，它有一个 AI 披露声明生成器（Disclosure Mode），帮你按照 NeurIPS、Nature、Science 等顶会的要求，生成规范的 AI 使用声明。

作者甚至还设计了一套「反幻觉机制」。

他在 v2.7 版本做了一次压力测试。让完整性验证 Agent 检查整篇论文的所有引用。结果 68 条参考文献里检查出 21 条有问题。31% 的错误率。而且这些错误是经过 3 轮完整性检查之后的漏网之鱼。

4 条完全编造的文献、6 处作者名写错、7 处元数据对不上、2 处格式问题。

从那以后，项目加入了 Semantic Scholar API 验证（调用学术搜索引擎的接口逐条核实文献是否存在）、反信息泄露协议（防止 AI 把训练数据里的错误信息当成事实写进去）、还有一套 5 类引用幻觉分类法。

v3.0 版本又针对那个唱反调的角色加入了反谄媚机制。AI 审稿时被作者反驳，不能轻易认怂道歉。每次让步前必须给对方的反驳打 1-5 分，只有达到 4 分以上才允许让步。连续让步直接触发告警。

这些机制的灵感来源是 Google 2026 年的 PaperOrchestra，和 Nature 651 卷发表的 Lu et al. 2026（第一个通过盲审的全自动 AI 研究系统）。

跑完一篇 1.5 万字论文的完整流程，API 费用大约 4-6 美元。加上人类研究者 2-4 小时的参与时间。

使用很简单。Claude Code 里两行命令搞定。

/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills

安装后输入 /ars-plan，系统会用苏格拉底式对话帮你梳理论文结构。

回过头想，学术研究里那些苦力活确实应该被自动化。

找文献、核对引用格式、检查前后数据一致性、追踪审稿意见是否被逐条回应。这些工作占据了研究者大量时间，但不需要创造性思维。

问题从来不是「该不该用 AI」。问题在于「用在哪一步，边界在哪里」。

这个项目给出了一个答案。

AI 负责检查，人负责判断。AI 负责格式，人负责论证。AI 负责找漏洞，人负责决定这个漏洞的重要程度。

可能不是所有研究者都想用 AI 写论文。但大多数研究者，都希望少花点时间在格式和文献上。

我是木易，Top2 + 美国 Top10 CS 硕，现在是 AI 产品经理。
关注「AI信息Gap」，让 AI 成为你的外挂。