Py学习  »  Git

发现 3 个牛哄哄 AI 的 GitHub 开源项目,速速收藏。

小哈学Java • 1 月前 • 61 次点击  

01

小红书采集神器

这个叫 Spider_XHS 的小红书爬虫神器,已经在 GitHub 上获得 3000 多 Star 了。

它不仅是一个爬虫工具,更是一套小红书全域运营的解决方案。

这个开源的小红书数据采集开源项目支持多种维度的数据抓取,能够将数据保存为 Excel 表格或直接下载多媒体文件。

某个用户所有的小红书笔记,能保存到本地文件夹:

每一个笔记都是按照如下这种方式保存,能自动提取并下载高清无水印图片,还能保存笔记链接、标题、点赞/收藏数据等等。


👉 欢迎加入小哈的星球,你将获得: 专属的项目实战(多个项目) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

  • 新项目:《Spring AI 项目实战》正在更新中..., 基于 Spring AI + Spring Boot 3.x + JDK 21;
  • 《从零手撸:仿小红书(微服务架构)》 已完结,基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍 演示地址:http://116.62.199.48:7070/
  • 《从零手撸:前后端分离博客项目(全栈开发)》 2期已完结,演示链接:http://116.62.199.48/;
  • 专栏阅读地址:https://www.quanxiaoha.com/column

截止目前,累计输出 100w+ 字,讲解图 4013+ 张,还在持续爆肝中.. 后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,Spring Cloud Alibaba 等等,戳我加入学习,解锁全部项目,已有4100+小伙伴加入

图片


除了爬之外,它还集成了创作者平台的接口,支持笔记的自动化上传,简直是运营人的效率倍增器。

使用该项目需要具备基础的 Python 和 Node.js 环境。

第一步:克隆项目与安装依赖

# 下载项目git clone https://github.com/cv-cat/Spider_XHS.gitcd Spider_XHS
# 安装 Python 依赖pip install -r requirements.txt
# 安装 Node.js 依赖(用于加密参数生成)npm install

第二步:配置 Cookie

这是最关键的一步。项目根目录有一个 .env 文件,如果没有则新建一个,你需要将自己的小红书 Cookie 填入其中。

① 浏览器打开小红书网页版并登录。

② 按 F12 打开开发者工具,找到 Network (网络) 选项卡。

③ 刷新页面,随便点击一个请求,在 Request Headers 中找到 cookie 字段。

④ 将 Cookie 复制并粘贴到  .env 文件中。

第三步:运行爬虫

项目入口是 main.py,你可以根据需求修改代码中的调用逻辑,然后直接运行:

python main.py

运行后,你会在控制台看到采集进度,采集到的数据和媒体文件会自动保存在相应的文件夹中。

开源地址:https://github.com/cv-cat/Spider_XHS

02

PPT Agent

PPTAgent 是中科院计算所开源的项目。

它不仅能根据一句话生成PPT,还能直接读懂长文档,自动提炼重点生成幻灯片。

与市面上简单的文本转Markdown转PPT不同,PPTAgent 采用了一种更加智能的多智能体(Multi-Agent) 流程,模拟了人类制作 PPT 的完整思考过程。

比如,让这个开源项目生成一个 PPT,介绍小米 SU7 的外观和价格。

生成的 PPT 会适配不同的商务或学术风格。可以根据每页的内容,自动搜索并插入相关的图片。

又或者制作一份高中课堂展示课件,主题为“解码立法过程:理解其对国际关系的影响”

PPTAgent 支持上传本地文件,比如论文、技术报告、财报。

它会利用 RAG 技术,从长文中提取关键信息,确保生成的 PPT 内容准确、详实,而不是一本正经地胡说八道。

牛逼的是 PPTAgent 直接输出原生的 .pptx 文件,你在 PowerPoint 软件里打开就能随意修改、拖拽、美化,完全没有兼容性问题。

开源地址:https://github.com/icip-cas/PPTAgent

03

Code2Video

别再死磕 Sora 了,这个开源项目用代码生成高质量教学视频。

它不走寻常路,不直接生成像素,而是通过写代码(Manim)来生成视频

这意味着它生成的视频逻辑严密、清晰度满分,而且 每一帧都可以精准修改。

简单来说,Code2Video 是一个由 AI 智能体驱动的框架,灵感来自于那个著名的数学科普大神 3Blue1Brown,他背后的动画引擎就是 Manim

Code2Video 相当于给你配了一个 24 小时待命的 Python 程序员,专门帮你写 Manim 代码来做动画。

该项目由新国立大学团队开发,刚刚获得 1K 的 Star。来看看和 Veo3 等 AI 视频结果相比,Code2Video 的效果咋样。

开源地址:https://github.com/showlab/Code2Video

👉 欢迎 加入小哈的星球,你将获得: 专属的项目实战(多个项目) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

  • 新项目:《Spring AI 项目实战》正在更新中..., 基于 Spring AI + Spring Boot 3.x + JDK 21;
  • 《从零手撸:仿小红书(微服务架构)》 已完结,基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍演示地址:http://116.62.199.48:7070/
  • 《从零手撸:前后端分离博客项目(全栈开发)》 2期已完结,演示链接:http://116.62.199.48/;
  • 专栏阅读地址:https://www.quanxiaoha.com/column

截止目前,累计输出 100w+ 字,讲解图 4013+ 张,还在持续爆肝中.. 后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,Spring Cloud Alibaba 等等,戳我加入学习,解锁全部项目,已有4100+小伙伴加入

图片


图片

1. 我的私密学习小圈子,从0到1手撸企业实战项目~

2. SpringBoot+OnlyOffice:优雅实现在线 Word 编辑、转化、保存等功能

3. IDEA深度用户必备:高效部署技巧,一键搞定项目发布

4. Redis:大数据中如何抗住2000W的QPS

图片

最近面试BAT,整理一份面试资料Java面试BATJ通关手册,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。

获取方式:点“在看”,关注公众号并回复 Java  领取,更多内容陆续奉上。

PS:因公众号平台更改了推送规则,如果不想错过内容,记得读完点一下在看,加个星标,这样每次新文章推送才会第一时间出现在你的订阅列表里。

“在看”支持小哈呀,谢谢啦

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/189885