01
小红书采集神器
这个叫 Spider_XHS 的小红书爬虫神器,已经在 GitHub 上获得 3000 多 Star 了。
它不仅是一个爬虫工具,更是一套小红书全域运营的解决方案。
这个开源的小红书数据采集开源项目支持多种维度的数据抓取,能够将数据保存为 Excel 表格或直接下载多媒体文件。某个用户所有的小红书笔记,能保存到本地文件夹:
每一个笔记都是按照如下这种方式保存,能自动提取并下载高清无水印图片,还能保存笔记链接、标题、点赞/收藏数据等等。
👉 欢迎加入小哈的星球,你将获得: 专属的项目实战(多个项目) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论
- 新项目:《Spring AI 项目实战》正在更新中..., 基于 Spring AI + Spring Boot 3.x + JDK 21;
- 《从零手撸:仿小红书(微服务架构)》 已完结,基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍;
演示地址:http://116.62.199.48:7070/
- 《从零手撸:前后端分离博客项目(全栈开发)》 2期已完结,演示链接:http://116.62.199.48/;
- 专栏阅读地址:https://www.quanxiaoha.com/column
截止目前,累计输出 100w+ 字,讲解图 4013+ 张,还在持续爆肝中.. 后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,Spring Cloud Alibaba 等等,戳我加入学习,解锁全部项目,已有4100+小伙伴加入
除了爬之外,它还集成了创作者平台的接口,支持笔记的自动化上传,简直是运营人的效率倍增器。使用该项目需要具备基础的 Python 和 Node.js 环境。
第一步:克隆项目与安装依赖
git clone https://github.com/cv-cat/Spider_XHS.gitcd Spider_XHS
pip install -r requirements.txt
npm install
第二步:配置 Cookie
这是最关键的一步。项目根目录有一个 .env 文件,如果没有则新建一个,你需要将自己的小红书 Cookie 填入其中。
① 浏览器打开小红书网页版并登录。
② 按 F12 打开开发者工具,找到 Network (网络) 选项卡。
③ 刷新页面,随便点击一个请求,在 Request Headers 中找到 cookie 字段。
④ 将 Cookie 复制并粘贴到
.env 文件中。
第三步:运行爬虫
项目入口是 main.py,你可以根据需求修改代码中的调用逻辑,然后直接运行:
运行后,你会在控制台看到采集进度,采集到的数据和媒体文件会自动保存在相应的文件夹中。
02
PPT Agent
PPTAgent 是中科院计算所开源的项目。
它不仅能根据一句话生成PPT,还能直接读懂长文档,自动提炼重点生成幻灯片。
与市面上简单的文本转Markdown转PPT不同,PPTAgent 采用了一种更加智能的多智能体(Multi-Agent) 流程,模拟了人类制作 PPT 的完整思考过程。
比如,让这个开源项目生成一个 PPT,介绍小米 SU7 的外观和价格。
生成的 PPT 会适配不同的商务或学术风格。可以根据每页的内容,自动搜索并插入相关的图片。
又或者制作一份高中课堂展示课件,主题为“解码立法过程:理解其对国际关系的影响”
PPTAgent 支持上传本地文件,比如论文、技术报告、财报。
它会利用 RAG 技术,从长文中提取关键信息,确保生成的 PPT 内容准确、详实,而不是一本正经地胡说八道。
牛逼的是 PPTAgent 直接输出原生的 .pptx 文件,你在 PowerPoint 软件里打开就能随意修改、拖拽、美化,完全没有兼容性问题。
03
Code2Video
别再死磕 Sora 了,这个开源项目用代码生成高质量教学视频。
它不走寻常路,不直接生成像素,而是通过写代码(Manim)来生成视频。
这意味着它生成的视频逻辑严密、清晰度满分,而且
每一帧都可以精准修改。
简单来说,Code2Video 是一个由 AI 智能体驱动的框架,灵感来自于那个著名的数学科普大神 3Blue1Brown,他背后的动画引擎就是 Manim。
Code2Video 相当于给你配了一个 24 小时待命的 Python 程序员,专门帮你写 Manim 代码来做动画。
该项目由新国立大学团队开发,刚刚获得 1K 的 Star。来看看和 Veo3 等 AI 视频结果相比,Code2Video 的效果咋样。
👉 欢迎
加入小哈的星球,你将获得: 专属的项目实战(多个项目) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论
- 新项目:《Spring AI 项目实战》正在更新中..., 基于 Spring AI + Spring Boot 3.x + JDK 21;
- 《从零手撸:仿小红书(微服务架构)》 已完结,基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍;演示地址:http://116.62.199.48:7070/
-
《从零手撸:前后端分离博客项目(全栈开发)》 2期已完结,演示链接:http://116.62.199.48/;
- 专栏阅读地址:https://www.quanxiaoha.com/column
截止目前,累计输出 100w+ 字,讲解图 4013+ 张,还在持续爆肝中.. 后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,Spring Cloud Alibaba 等等,戳我加入学习,解锁全部项目,已有4100+小伙伴加入
最近面试BAT,整理一份面试资料《Java面试BATJ通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式:点“在看”,关注公众号并回复 Java
领取,更多内容陆续奉上。
PS:因公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。
点“在看”支持小哈呀,谢谢啦