嗨喽!GitHub科技的各位小伙伴们,由于公众号做了乱序推送改版,为了保证公众号的推文能够第一时间及时送达到大家手上,大家记得将公众号 加星标置顶 ,公众号每天会送上 3 个 GitHub 开源项目给大家学习 !
1
Midscene
它是由字节开源的一款AI驱动的UI自动化工具。官网的Solgen:Midscene.js - AI 驱动,带来愉悦的 UI 自动化体验。从这个Solgen可以看出,它主要是通过大语言模型解析用户的自然语言指令,然后通过底层的自动化框架进行交互,将这些解析后的指令转为具体的页面操作代码。大大提高了操作浏览器的效率,让我们的有更愉悦的UI自动化体验。
https://github.com/web-infra-dev/midscene
2
Magentic UI
Magentic UI是一款由微软开源的,宗旨“以人为本”的智能体。它是通过人机交互方式,来实现网页的浏览和执行、代码的生成和执行、以及文件的生成和分析。成为你工作中的一个超级AI助手。https://github.com/microsoft/magentic-ui
3
Flyde
一款开源的可视化编程工具。主要功能是通过拖拽连接不同的“节点”来创建程序。这些“节点”可以是各种功能模块,比如读取数据、处理数据、调用AI模型数据,通过连接这些节点可以快速构建出复杂的程序逻辑,大大提高了编程的效率。
https://github.com/flydelabs/flyde
4
WSL
WSL全称Windows Subsystem for Linux , 翻译过来就是把Linux系统放到Windows系统里使用。其实就是Windows操作系统的一个功能,允许用户在Windows上运行Linux环境(包括命令行工具、实用程序、应用程序),无需像传统模式使用虚拟机或者双启动设置。主要面向Web开发人员以及需要部署到Linux服务器的用户,提供高效的跨平台开发体验。
https://github.com/microsoft/WSL5
Dolphin
最近字节跳动开源了一款创新多模态文档图像解析模型——Dolphin,基于先解析结构后解析内容的两阶段方法,参数只有322M,16G显存就能流畅运行,而且效果比不输GPT-4.1!
目前支持Pdf和图片直接解析成Markdown和Json格式。官网直接给出了Demo在线地址,真的太良心了!直接上手体验!
http://115.190.42.15:8888/dolphin/
https://github.com/bytedance/Dolphin

6
Suna
Suna是Kortix AI推出的一款通用型AI Agent开源项目,Suna将大型语言模型与专业工具链深度整合,能够通过自然语言与用户交互,高效解决各种复杂任务。Suna以模块化架构设计为基础,不同功能模块可以灵活组合和扩展,用户可以根据具体需求定制Suna的功能,比如进行文档处理、研究分析、自动化任务、文件管理、网络等任务,可以有效提高工作效率。另外,Suna已在Github上开源,用户可以根据需要进行私有化部署。
https://github.com/kortix-ai/suna
--完--
读到这里说明你喜欢本公众号的文章,欢迎 置顶(标星)本公众号 GitHub科技,这样就可以第一时间获取推送了~在
本公众号,后台回复:666 ,领取一份国内最顶级的 GitHub 开源项目排行榜单 !