项目在GitHub上已获得约3600+star,探秘 ChatDoctor：LLaMA 微调后的 AI 医生，真能在线问诊？

嗨，我是小华同学，专注解锁高效工作与前沿AI工具！每日精选开源技术、实战技巧，助你省时50%、领先他人一步。👉免费订阅，与10万+技术人共享升级秘籍！

代医疗资源分布不均、诊间时间短、AI 医疗产品不断兴起，医疗问答助手的需求痛点凸显。ChatDoctor 正是诞生于医生问诊效率瓶颈下，通过 LLaMA 在医学领域语料和问答对话的深度微调，实现面向医疗领域的自然语言问答助手。

为什么我们需要 ChatDoctor？

ChatDoctor 针对这些痛点进行了实质性改进。

医学对话微调：融合 HealthCareMagic-100k、icli niq‑10k 以及 GenMedGPT‑5k，自定义医患对话风格，提升专业度。
真实医疗场景语料：100k + 10k 医患对话、700 种疾病症状、用药、体检数据训练集，覆盖面广。
外部检索能力：实时调用维基百科和权威疾病库，实现 Retrieval‑Augmented Prompting，提高回复时效和权威性。
LoRA 微调支持：提供标准训练与 LoRA 节约版，支持资源受限环境下的再次 fine‑tune 。
临床实验结果卓越：在 iCliniq 数据对比 ChatGPT，药物推荐准确率提升至 91.25% vs 87.5%。
开源开放：源码、数据、训练脚本、模型权重全面开源，推动医疗对话模型进一步发展。

技术模块	优势说明
数据质量	医患真实对话，清洗匿名、语法校正，保证医疗用词准确
双阶段微调策略	基础问答 + 医学专业对话，兼顾流畅与准确
实时检索机制	查维基与库内容补足知识时效性，减少 hallucination
节省计算资源	LoRA 支持适配中小型 GPU 训练
实验验证	比肩 ChatGPT，药物推荐更专业

以下截图来自官方 Demo，展示 ChatDoctor 的核心交互能力：

（此处应显示对应截图，若页面已有无须复述）

项目	数据来源	检索设计	推荐准确率	微调策略	开源程度
ChatDoctor	100k+10k真实对话	有	91.25%	双阶段+LoRA	全开源
Me‑LLaMA	自建指令式医疗数据	无	略逊	单阶段	开源部分
BioMistral	PubMed 文本	未指明	较优秀	单阶段	开源
ChatGPT 医疗应用	通用大模型适配	无	87.5%	Closed	不开源