社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

新智元 • 2 周前 • 51 次点击  



  新智元报道  

编辑:定慧
【新智元导读】ChatGPT悄悄上线的直连Github新功能太强大!一旦连上Github,立马化身「研究怪兽」:不管是DeepSeek这样的明星开源项目,还是自己DIY的文档资料,只要放进仓库,就能交给深度研究,一键生成专业到飞起的报告。

大概5天前,ChatGPT「悄悄」上线了一个新功能,就是Deep Research功能可以直连Github仓库。

这个功能刚推出时,第一反应是给程序员用的,但是最近使用后才发现这个功能非常强大——应用场景远比想象的更加广阔。

不仅仅是审查代码,或者生成报告,能够连接Github的ChatGPT在重度使用后,效果还是超乎想象的——几乎可以进行任何方向的深度研究。

只要是Github开源的公开仓库,都可以通过:「项目官方仓库——Fork仓库到个人账号——ChatGPT——Github连接器——深度研究——选择个人仓库——完成报告」的链条来快速输出专业级别的研究报告!

先简单介绍下,这次连接Github后,ChatGPT具备了自动读取、解析并总结整个GitHub仓库的能力。

过去想要发掘和研究一个开源项目,通常需要好几天的时间来阅读源码,但是现在有了ChatGPT+Github这个连接器,效率得到了指数级的提升。

如果说过去在Github挖宝是拿着铁锹,这下直接开上挖掘机了!

比如我让ChatGPT来分析我仓库中的一个,第一步还是常规的Deep Research步骤,先确定研究内容,然后任务启动。

ChatGPT会对整个仓库代码的功能架构、核心模块、技术栈以及维护状态等进行全面分析。

在进行了一段时间的研究后,就可以输出一份非常专业,并且几乎没有幻觉的研究报告。

这份报告,几乎已经完成了对一个项目能做所有的研究和分析。

这份报告主要包含六个主要部分:1.技术架构 2.核心模块分析 3.代码质量评估 4.文档情况 5.仓库活跃度与维护状态 6.项目的适用性

那既然能研究一个仓库,那是不是能研究其他仓库?而Github的仓库不一定非得是代码,是可以上传任何的文件的。

等会,既然ChatGPT可以提供强大的深度研究能力,而Github连接器又限定了研究的范围,这两个能力加起来不就是相当于一个面向特定领域的非常专业的研究员吗!

以前没有这个功能的时候,ChatGPT主要依靠联网来进行深度研究,虽然能够获取的信息多了,但是「幻觉」的概率也会同步增大。

但是如果通过在Github来限定「研究范围」,那ChatGPT给出的「深度研究」报告是不是会更专业?

而限定范围很容易做到,只要将仓库内容换成你想要的资料就好了,这也相当于是一个专门的RAG+MCP功能啊。

说干就干,下面就用Github上开源仓库代码来试试效果。

整个活:套娃式研究DeepSeek

这次想让ChatGPT出一份关于DeepSeek-R1的专业分析报告,正好DeepSeek-V3就在Github已经开源了。

只需要在深度研究下面选择连接Github,并选择对应的仓库即可。

这里为了方便操作,我是先把DeepSeek-R1 fork到了我自己的仓库中,因为ChatGPT和Github的连接器需要索引找到仓库,所以重新复制一份到个人仓库会加快索引的速度。

所以流程就是:

DeepSeek-R1官方仓库——DeepSeek-R1 Fork仓库——ChatGPT——Github连接器——选择深度研究——选择Github仓库为DeepSeek-R1 Fork仓库。

然后就可以倒杯咖啡,看着ChatGPT工作了,只需10分钟!

当ChatGPT开始深度研究后,他的界面如下图所示,右侧标识了活动过程和调用的研究信息资源。

可以看到在这个任务中,ChatGPT只使用了Github仓库限定的文件内容。

等待十几分钟到二十分钟左右,ChatGPT就在幕后认真的处理和思考这些信息。

你可以看到这个报告真的非常的长,非常的详细,每个部分都能溯源到原始文件的位置。

感兴趣的可以通过这个链接来查看:https://chatgpt.com/share/682571fe-52c8-8013-a8f1-c85562ec1850

简单介绍下生成报告的质量,报告一开始讲的是R1的模型架构,然后是R1的数据训练流程,接着讲了训练机制和推理和部署,最后还对模型的创新点做了阐述。

可以说是一份非常完善的模型研究报告,并且使用的DeepSeek-R1的官方仓库,甚至结尾还有DeepSeek-R1的模块源码解释。

可以说是非常的详细了。

使用ChatGPT+Github这种深度研究的另一种好处就是,出了研究报告后,可以直接在ChatGPT中直接提问来进行进一步的研究。

整个流程顺滑无比。

使用「索引技巧」来加快仓库被发现的进度

需要注意的一点是,目前ChatGPT+Github连接器在索引仓库时,并没有那么快。

比如这里刚开始我就一直搜索不到,不断重启连接器也无法找到仓库,不论是自己的还是其他Public公开的仓库。

后来在OpenAI的官方文档中才找到说明。OpenAI提到了Github的仓库需要手动激活后才能加到索引列表,才能被连接器找到。

ChatGPT也针对这个问题给出了解决方案,那就是将仓库在Github的搜索框中搜一下,或者上传一个新的更新。

不一定是代码

实际上,ChatGPT的这个功能其实非常强大,上面主要使用的是访问Github仓库来进行深度研究的功能。

那么引申一下,就可以将一些特定的内容,比如PDF、Word等上传到新建的仓库中,然后使用这个流程来进行研究。

这样就把研究资料限定在固定的范围内,同时还能利用Github连接器本身对各种文件的编排能力,毕竟在分析一个项目仓库时,Github本身也是会区分不同的文件类型。

这就是一个相当完美的RAG+MCP组合,不仅能使用ChatGPT强大的模型能力,还可以使用Github构建仓库的能力,简直完美。

最关键的是,这个功能只要是开通了Plus的用户即可使用,从这一点上来说,ChatGPT Plus这次终于值回了20美元的票价。

这种将ChatGPT和GitHub深度连接、相互强化的新玩法,其实就是开启了一种全新的研究模式。

不管你是想要快速上手一个陌生的开源项目,还是精准分析特定领域的内容,都能用上这个组合。

更关键的是,这种玩法甚至能够扩展到各种类型的研究资料中去,实现了真正的RAG+MCP组合——专业又高效。

如果你还有更好玩,更有趣的玩法,欢迎在评论区交流。

参考资料:
https://help.openai.com/en/articles/11145903-connecting-github-to-chatgpt-deep-research
https://x.com/OpenAIDevs/status/1920556386083102844

图片


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182293
 
51 次点击