社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

一键安装最新生产环境GraphRAG UI,kotaemon日增1.3KStar霸榜Github

AI修猫Prompt • 12 月前 • 723 次点击  

点击上方蓝字关注我

这两天Github上有一个项目火了。可用于生产环境GraphRAG的开源UI项目kotaemon,更新不到两天后已经有6.6KStar,昨日新增1.3KStar已位居Github Trending榜首。周末抽空部署了一下,还挺简单,推荐给大家。

可能大家用了一段时间GraphRAG感觉还不错。但很多读者反应,不好部署,也不知该怎么用,那么这个UI界面的GraphRAG或许可以解决这些个问题。我还是用上篇文章介绍的论文作为示例为大家讲解如何部署和设置:

往期推荐

DeepMind最新:生成验证器(GenRM),让爆火的Best-of-N准确率提高16-64%

01

Kotaemon的主要功能

简洁且可定制的UI

Kotaemon的用户界面设计简洁实用,支持多用户登录,使团队能够在私人或公共集合中组织文件并协作查询文档。UI基于Gradio构建,为开发者提供了添加或修改UI元素的灵活性,以满足特定需求。

图片由修猫创作

支持多模态和多文档查询

Kotaemon的一大亮点在于其处理多模态查询的能力。它支持解析带有图表和表格的文档,适用于多种数据类型。系统能够在多个文档中执行问答(QA),即使是复杂的查询也能提供全面的响应。

高级引用和文档预览

Kotaemon包括先进的引用功能,用户可以在浏览器内的PDF查看器中查看详细的引用信息,并附有高亮显示和相关性评分。这一功能对于需要验证来源的领域尤为重要。

可配置的检索和生成流程

Kotaemon允许开发者通过UI直接调整检索和生成过程的关键参数。这包括自定义提示词、选择文档存储和向量存储,以及启用或禁用多模态QA。这些配置让开发者能够根据特定应用需求定制系统。

02

部署设置Kotaemon

安装选项

这个GraphRAG UI有两个版本,一个是APP版,一个是main版。无论你用的是Win还是Mac,在最新的releases中可一键部署APP版,双击鼠标那种;我用的是开发者main版,解压源文件自带Dockerfile文件,部署在Docker中,也很简单。一行命令即可:

Kotaemon提供了两种主要的安装方法:使用Docker或双击bat文件(Win)或.sh文件(Linux、Mac)启动。对于大多数用户,推荐使用Docker,因为它简化了依赖管理,并确保了跨系统的一致性环境,会节省你大量时间。

Docker安装

通过Docker,开发者可以根据自己需要快速部署Kotaemon,docker run你部署的镜像,或者docker compose up一个写好的启动yaml文件即可在本地运行服务器。这种方法简化了依赖管理,确保了跨系统的一致性环境。

手动设置

对于那些更喜欢掌控环境的开发者,Kotaemon也可以在Python环境中手动设置。这需要克隆代码库,安装必要的包,并配置环境变量.env文件,如LLM提供商的API密钥。

配置模型

第一次启动本地7860端口可能需要点时间,页面报错你稍等一下。当你启动以后,你应该可以看到如下界面,直接填如两个admin即可。

从上面的界面进来以后,以下是您需要依次进行设置的顺序:

设置完Setting这一步,还需要根据自己的需求对Reasoning setting中的各种Prompt进行定义,这就看你喜好了。之后,就可以去第3步,上传PDF文件进行index了,最后一步第4步,才是在首页Chat。经过您精心调整参数,相信您也一定可以看到如下项目首页类似的结果。

03

Kotaemon的高级功能

修改RAG管道

Kotaemon的一大优势在于其可扩展性。开发者可以修改默认的RAG管道,或通过Python实现自定义逻辑创建全新的管道。这种灵活性允许为特定用例集成定制化的检索和推理方法。Kotaemon用到一个高级的RAG管道haystack,这是一个上千家大型企业在工业生产环境中应用的高级RAG产品,很多一线AI厂商也都在用,之后有机会我会为大家介绍,在此mark一下。

扩展索引管道

Kotaemon包含一个基于图形的索引管道的示例实现,开发者可以自定义或替换为其他索引策略。对于处理大型、复杂文档库的开发者来说,这一功能尤为重要。

UI定制

由于其基于Gradio的架构,Kotaemon的UI高度可定制。开发者可以根据需要添加新组件、调整布局,并集成额外功能。这一功能对于创造符合特定应用需求的用户体验至关重要。这个UI定制我还在探索中。

04

Kotaemon的最佳实践

企业文档管理

Kotaemon非常适合企业应用,在这些应用中,管理和查询大型文档库是常见需求。其多用户支持、先进的引用功能和可配置的检索设置,使其成为法律、金融和医疗等行业的理想工具。

科研与学术

对于研究人员和学术机构而言,Kotaemon提供了一个强大的平台,用于探索大型数据集和进行文献综述。其处理复杂、多跳查询和提供详细引用的能力,确保了响应的准确性和可追溯性。

定制AI解决方案

AI开发者可以利用Kotaemon作为基础,创建定制的RAG管道。无论是开发客户支持聊天机器人,还是构建技术文档分析工具,Kotaemon都提供了适应各种用例的灵活性。

如果你遇到安装或设置上的问题,欢迎你来群里与我交流。

非常感谢大家对我的支持和认可。自2024年6月18日起再进入赞赏群,需赞赏两篇文章各200元(共400元),我特意开了新群。赞赏低于400元仅视为对作者的喜欢。


您赞赏完毕后我将赠与您以下这些公众号文章末尾提及的文件并拉您进群,以表达对您赞赏的感谢:


1、自4月11日至8月19日80多篇文章文末提及的附件110多份,包括:


A:语气关键字提取Prompt、自我发现Promt、预测prompt、Tom谈判、GPT记忆、参与式Prompt、弦外音、Medprompt、语义嵌入向量提示词、类比提示、检索增强RAT、TextGrad、UNIPrompt、贝叶斯优化等优质提示词、优化过的CoT prompt框架、Auto EvolInstruct优化Prompt、变分推理内容生成的prompt、递归内省的系统级SYSTEM PROMPT、Q-Star XML prompt、C2P因果推理链Prompt、知识图谱因果推理prompt、知识图谱结构为prompt等


B、微调、SAMMO优化、DSPy运行环境部署等Dockerfile文件


C、能运行的代码包括:本地模型运行DSPy写的Agent、DSPy意图识别代码、DSPy与Langchain优化Prompt 、prompt-SAW提示压缩、概率迭代优化Prompt代码

、SymbolCot的DSPy代码、提示词敏感性和一致性代码、GraphRAG转PDF成为数据集代码等


D、公众号文章介绍过的50多篇论文、资料尤其是谷歌提示、Prompt调查报告等重磅资料


2、和与您一样的共识者探讨本公众号有关的文章、技术,共同进步


3、就文章涉及的问题向本人咨询



赞赏完成后,请添加我的微信xiumaoprompt拉您入群。本群有效期为永久,除非特殊情况下的解散。



  1. 转载请与本喵联系,私自抓取转载将被起诉
🎉让我们一起创造更多美好! 🎉

如果您觉得这篇文章对您有帮助或启发
感谢您为我【点赞】【在看】


👉微信号:xiumaoprompt

如果你不能及时回应,请勿添加




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173771
 
723 次点击