点击上方蓝字关注我
这两天Github上有一个项目火了。可用于生产环境GraphRAG的开源UI项目kotaemon,更新不到两天后已经有6.6KStar,昨日新增1.3KStar已位居Github Trending榜首。周末抽空部署了一下,还挺简单,推荐给大家。


可能大家用了一段时间GraphRAG感觉还不错。但很多读者反应,不好部署,也不知该怎么用,那么这个UI界面的GraphRAG或许可以解决这些个问题。我还是用上篇文章介绍的论文作为示例为大家讲解如何部署和设置:

简洁且可定制的UI
Kotaemon的用户界面设计简洁实用,支持多用户登录,使团队能够在私人或公共集合中组织文件并协作查询文档。UI基于Gradio构建,为开发者提供了添加或修改UI元素的灵活性,以满足特定需求。

图片由修猫创作
支持多模态和多文档查询
Kotaemon的一大亮点在于其处理多模态查询的能力。它支持解析带有图表和表格的文档,适用于多种数据类型。系统能够在多个文档中执行问答(QA),即使是复杂的查询也能提供全面的响应。
高级引用和文档预览
Kotaemon包括先进的引用功能,用户可以在浏览器内的PDF查看器中查看详细的引用信息,并附有高亮显示和相关性评分。这一功能对于需要验证来源的领域尤为重要。
可配置的检索和生成流程
Kotaemon允许开发者通过UI直接调整检索和生成过程的关键参数。这包括自定义提示词、选择文档存储和向量存储,以及启用或禁用多模态QA。这些配置让开发者能够根据特定应用需求定制系统。
安装选项
这个GraphRAG UI有两个版本,一个是APP版,一个是main版。无论你用的是Win还是Mac,在最新的releases中可一键部署APP版,双击鼠标那种;我用的是开发者main版,解压源文件自带Dockerfile文件,部署在Docker中,也很简单。一行命令即可:

Kotaemon提供了两种主要的安装方法:使用Docker或双击bat文件(Win)或.sh文件(Linux、Mac)启动。对于大多数用户,推荐使用Docker,因为它简化了依赖管理,并确保了跨系统的一致性环境,会节省你大量时间。
Docker安装
通过Docker,开发者可以根据自己需要快速部署Kotaemon,docker run你部署的镜像,或者docker compose up一个写好的启动yaml文件即可在本地运行服务器。这种方法简化了依赖管理,确保了跨系统的一致性环境。

手动设置
对于那些更喜欢掌控环境的开发者,Kotaemon也可以在Python环境中手动设置。这需要克隆代码库,安装必要的包,并配置环境变量.env文件,如LLM提供商的API密钥。
配置模型
第一次启动本地7860端口可能需要点时间,页面报错你稍等一下。当你启动以后,你应该可以看到如下界面,直接填如两个admin即可。

从上面的界面进来以后,以下是您需要依次进行设置的顺序:




设置完Setting这一步,还需要根据自己的需求对Reasoning setting中的各种Prompt进行定义,这就看你喜好了。之后,就可以去第3步,上传PDF文件进行index了,最后一步第4步,才是在首页Chat。经过您精心调整参数,相信您也一定可以看到如下项目首页类似的结果。

修改RAG管道
Kotaemon的一大优势在于其可扩展性。开发者可以修改默认的RAG管道,或通过Python实现自定义逻辑创建全新的管道。这种灵活性允许为特定用例集成定制化的检索和推理方法。Kotaemon用到一个高级的RAG管道haystack,这是一个上千家大型企业在工业生产环境中应用的高级RAG产品,很多一线AI厂商也都在用,之后有机会我会为大家介绍,在此mark一下。
扩展索引管道
Kotaemon包含一个基于图形的索引管道的示例实现,开发者可以自定义或替换为其他索引策略。对于处理大型、复杂文档库的开发者来说,这一功能尤为重要。
UI定制
由于其基于Gradio的架构,Kotaemon的UI高度可定制。开发者可以根据需要添加新组件、调整布局,并集成额外功能。这一功能对于创造符合特定应用需求的用户体验至关重要。这个UI定制我还在探索中。
企业文档管理
Kotaemon非常适合企业应用,在这些应用中,管理和查询大型文档库是常见需求。其多用户支持、先进的引用功能和可配置的检索设置,使其成为法律、金融和医疗等行业的理想工具。
科研与学术
对于研究人员和学术机构而言,Kotaemon提供了一个强大的平台,用于探索大型数据集和进行文献综述。其处理复杂、多跳查询和提供详细引用的能力,确保了响应的准确性和可追溯性。
定制AI解决方案
AI开发者可以利用Kotaemon作为基础,创建定制的RAG管道。无论是开发客户支持聊天机器人,还是构建技术文档分析工具,Kotaemon都提供了适应各种用例的灵活性。
如果你遇到安装或设置上的问题,欢迎你来群里与我交流。
非常感谢大家对我的支持和认可。自2024年6月18日起再进入赞赏群,需赞赏两篇文章各200元(共400元),我特意开了新群。赞赏低于400元仅视为对作者的喜欢。
您赞赏完毕后我将赠与您以下这些公众号文章末尾提及的文件并拉您进群,以表达对您赞赏的感谢:
1、自4月11日至8月19日80多篇文章文末提及的附件110多份,包括:
A:语气关键字提取Prompt、自我发现Promt、预测prompt、Tom谈判、GPT记忆、参与式Prompt、弦外音、Medprompt、语义嵌入向量提示词、类比提示、检索增强RAT、TextGrad、UNIPrompt、贝叶斯优化等优质提示词、优化过的CoT prompt框架、Auto EvolInstruct优化Prompt、变分推理内容生成的prompt、递归内省的系统级SYSTEM PROMPT、Q-Star XML prompt、C2P因果推理链Prompt、知识图谱因果推理prompt、知识图谱结构为prompt等
B、微调、SAMMO优化、DSPy运行环境部署等Dockerfile文件
C、能运行的代码包括:本地模型运行DSPy写的Agent、DSPy意图识别代码、DSPy与Langchain优化Prompt 、prompt-SAW提示压缩、概率迭代优化Prompt代码
、SymbolCot的DSPy代码、提示词敏感性和一致性代码、GraphRAG转PDF成为数据集代码等
D、公众号文章介绍过的50多篇论文、资料尤其是谷歌提示、Prompt调查报告等重磅资料
2、和与您一样的共识者探讨本公众号有关的文章、技术,共同进步
3、就文章涉及的问题向本人咨询
赞赏完成后,请添加我的微信xiumaoprompt拉您入群。本群有效期为永久,除非特殊情况下的解散。