社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

3 个令人惊艳的 GitHub 项目,诞生了!

GitHubDaily • 11 月前 • 318 次点击  

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!


7 月转瞬即逝,2024 上半年在科技圈中,各大互联网公司如往常一样,依旧在 AI 领域打得不可开交。

OpenAI 正式对 Google 宣战发布 SearchGPT,为我们提供快速、及时且具有清晰、相关来源的答案;Meta AI 发布迄今为止最大的开源模型 Llama 3.1-405B,能力接近 GPT-4o 这些封闭的模型。

作为目前拥有诸多开发者受众的技术社区,GitHub 在过去这段时间,也陆陆续续诞生了不少实用的 AI 工具。

这些工具都有着相同的特点,简单易用且高效,主打一个新奇亮眼,顺便解放你的个人生产力。

今天就给大家推荐几个 GitHub 上比较热门的 AI 工具,让大家体验一下人工智能的神器与强大之处。

可视化爬虫,数据轻松抓取

记得爬虫工具已给大家推荐过许多,如 ScrapeGraphAI、Crawlee 等,但依然有不少同学跟我吐槽说操作太过复杂不会用。

今天再给大家推荐一个开源免费的可视化的爬虫平台 Kspider,更方便、更快捷、更好用,有手就行的爬虫工具。

通过以流程图的方式配置爬虫,提供了常用的功能,基本上无需编写代码即可完成数据爬取工作,对技术小白极其友好。

GitHub:https://github.com/kkangert/kspider

该工具拥有如下特性:

  • 支持 xpath 和 css 选择器;

  • 支持选择提取、正则提取、json 提取等;

  • 支持 Cookie 自动管理;

  • 支持插件插件扩展(自定义执行器,自定义函数等);

  • 支持爬取由 js 动态渲染的页面;

  • 支持爬虫可视化调试

  • 支持同步和异步执行;

  • 支持自定义 JS 脚本引擎。

另外,提供了方便快捷的管理 UI,可在线管理和调试任务、查看日志以及爬虫可视化调试等。

有了这款爬虫工具,相信我们的数据爬取工作定能事半功倍。

视频下载神器,简单易用

众所周知,网络上拥有多不胜数的优质视频资源,可惜的是,有不少平台都不支持下载。

作为一名程序员,我们可以通过繁琐的抓包方式来提取,但对于 m3u8(流媒体)格式的视频,处理步骤会多一点,对小白来说更是望而却步。

最近,我在 GitHub 上发现一款视频在线提取工具 Mediago,支持流媒体下载 、视频下载以及 B 站视频下载。

GitHub:https://github.com/caorushizi/mediago

主要特性:

  • 无需抓包:在其自带浏览器轻松嗅探网页中的视频资源,并可简单便捷选择下载。

  • 移动播放:可在 PC 和移动设备之间轻松无缝切换,电脑端下载完成后用手机观看。

  • 批量下载:支持同时下载多个视频和直播资源,高速带宽不闲置。

使用非常简单,只需复制视频播放的链接到其内置的浏览器,即可嗅探到视频资源,点击添加即可下载,如下图。

另外,该工具还有一个挺实用的功能,已下载的视频支持在手机观看,只需电脑与手机在同个局域网内即可。

工具提供开箱即用的安装包,支持 Windows 和 macOS 系统,有需求的可到其 Releases 页面选择适合自己的安装包下载。

如果你正在找一款简单易用、高效便捷的视频下载工具,不妨试试。

与你的 SQL 数据库对话

跟数据库打交道,可谓是每个程序员不可避免的日常工作之一。

这里给大家推荐一款,近日连续几天上榜 GitHub Trending 的开源项目:Vanna,一个能帮助我们更容易地与 SQL 数据库交互的工具。

GitHub:https://github.com/vanna-ai/vanna

它的工作流程主要分为两个步骤:

  1. 先在你的数据上训练出独有的 RAG(检索增强生成)模型;

  2. 然后以自然语言提出问题,即可准确返回 SQL 查询语句。

这个过程,我们甚至无需了解什么是 RAG 以及它背后的工作原理,只需简单的一句代码即可完成训练。

而且还支持接入目前主流大语言模型,如 ChatGPT、Claude、Gemini 以及 Llama 等。

对其工作原理感兴趣的,可看下图。

另外,项目完全开源,可以在自己本机上部署使用,在数据安全上能得到很大保护。

利用该款工具,可以快速实现一个基于 Text2SQL 方案的交互式数据库对话机器人,通过自然语言便能快速检索数据,快速提升工作效率。

以上,就是本期为大家推荐的几个 GitHub 项目,希望对大家有所帮助。

文中所提到的所有开源项目与工具,已收录至 GitHubDaily 的开源项目列表中。

该列表包含了 GitHub 上诸多高质量、有趣实用的开源技术教程、开发者工具、编程网站等内容。

从 2015 年至今,累计分享 3500+ 个开源项目,Star 增长 31000+,有需要的,可访问下方 GitHub 地址自取:

GitHub: https://github.com/GitHubDaily/GitHubDaily

好了,今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172752
 
318 次点击