公众号关注 “GitHubDaily”
设为 “星标”,每天带你逛 GitHub!
过去一年中,计算机视觉领域的 Vision Transformer 在深度学习领域已经杀红了眼,几乎是所到之处战无不胜!
前脚大家还在为 ICCV2021 best paper:Swin Transformer 欢呼!后脚 Swin Transformer V2 就出来了!甚至有开发者玩笑说:说不定已经出到 V5 了,只是怕大家看不过来,没全放出来~~
总之,Vision Transformer 的浪潮已经席卷了整个深度学习大圈,直追当年 CNN 问世时的劲头!
但是!但是咱们作为开发者心里就算再想赶上这趟飞的,现实中的 996、做不完的项目、打不完的杂都不会有一丝心软!
说句大实话,咱就想要个简洁清晰、能直接说明白这些爆款论文的创新点,直接给我开源的、完整的、代码舒服、文档清晰、用着顺手、跑起来有效果的 SOTA 算法代码库!
废话不多说,还真让我逮着这么一个库:
https://github.com/BR-IDL/PaddleViT
这个库是个基于 Visual Transformer 和 MLP 的开源模型和工具库,提供图像分类,目标检测,语义分割,图像生成等 视觉方向的 SOTA 模型和前沿工具。符合我对 ViT 模型库的几乎全部期待!
看 star 和 fork 数据目前还不是太知名,但是维护频率相当高,趁新鲜,兄弟们拿好不谢!
另外,这个模型库的页面上写着研究院大佬带队,征集 contributor,大家可以试一试。
页面上还有配套的课程,大家感兴趣的可以看一看~
地址自取哈:https://aistudio.baidu.com/aistudio/course/introduce/25102