01
小红书采集神器
这个叫 Spider_XHS 的小红书爬虫神器,已经在 GitHub 上获得 3000 多 Star 了。
它不仅是一个爬虫工具,更是一套小红书全域运营的解决方案。
这个开源的小红书数据采集开源项目支持多种维度的数据抓取,能够将数据保存为 Excel 表格或直接下载多媒体文件。某个用户所有的小红书笔记,能保存到本地文件夹:
每一个笔记都是按照如下这种方式保存,能自动提取并下载高清无水印图片,还能保存笔记链接、标题、点赞/收藏数据等等。除了爬之外,它还集成了创作者平台的接口,支持笔记的自动化上传,简直是运营人的效率倍增器。使用该项目需要具备基础的 Python 和 Node.js 环境。
第一步:克隆项目与安装依赖
git clone https://github.com/cv-cat/Spider_XHS.gitcd Spider_XHS
pip install -r requirements.txt
npm install第二步:配置 Cookie
这是最关键的一步。项目根目录有一个 .env 文件,如果没有则新建一个,你需要将自己的小红书 Cookie 填入其中。
① 浏览器打开小红书网页版并登录。
② 按 F12 打开开发者工具,找到 Network (网络) 选项卡。
③ 刷新页面,随便点击一个请求,在 Request Headers 中找到 cookie 字段。
④ 将 Cookie 复制并粘贴到 .env 文件中。
第三步:运行爬虫
项目入口是 main.py
,你可以根据需求修改代码中的调用逻辑,然后直接运行:
运行后,你会在控制台看到采集进度,采集到的数据和媒体文件会自动保存在相应的文件夹中。
02
PPT Agent
PPTAgent 是中科院计算所开源的项目。
它不仅能根据一句话生成PPT,还能直接读懂长文档,自动提炼重点生成幻灯片。
与市面上简单的文本转Markdown转PPT不同,PPTAgent 采用了一种更加智能的多智能体(Multi-Agent) 流程,模拟了人类制作 PPT 的完整思考过程。
比如,让这个开源项目生成一个 PPT,介绍小米 SU7 的外观和价格。
生成的 PPT 会适配不同的商务或学术风格。可以根据每页的内容,自动搜索并插入相关的图片。
又或者制作一份高中课堂展示课件,主题为“解码立法过程:理解其对国际关系的影响”
PPTAgent 支持上传本地文件,比如论文、技术报告、财报。
它会利用 RAG 技术,从长文中提取关键信息,确保生成的 PPT 内容准确、详实,而不是一本正经地胡说八道。
牛逼的是 PPTAgent 直接输出原生的 .pptx 文件,你在 PowerPoint 软件里打开就能随意修改、拖拽、美化,完全没有兼容性问题。
03
Code2Video
别再死磕 Sora 了,这个开源项目用代码生成高质量教学视频。
它不走寻常路,不直接生成像素,而是通过写代码(Manim)来生成视频。
这意味着它生成的视频逻辑严密、清晰度满分,而且每一帧都可以精准修改。
简单来说,Code2Video 是一个由 AI 智能体驱动的框架,灵感来自于那个著名的数学科普大神 3Blue1Brown
,他背后的动画引擎就是 Manim。
Code2Video 相当于给你配了一个 24 小时待命的 Python 程序员,专门帮你写 Manim 代码来做动画。
该项目由新国立大学团队开发,刚刚获得 1K 的 Star。来看看和 Veo3 等 AI 视频结果相比,Code2Video 的效果咋样。
04
点击下方卡片,关注逛逛 GitHub
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了: