Py学习  »  Git

谁是 2017 年度开源贡献之王?GitHub 数据分析报告

开源中国 • 6 年前 • 430 次点击  

扫描二维码进入西安源创会报名


有位作者分析了 2017 年截至今天 GitHub 上所有的 PushEvents......


作者对于每个 GitHub 用户都尽量分辨了他们属于哪个组织,并且只关注在 2017 年增长超过 20 个 star 的仓库(比如 Apache 目前在 GitHub 有超过 1500 个仓库,但只有 205 个在今年获得了 20 个以上的 star。因此,这里只分析这 205 个仓库的提交情况)。


各公司的贡献情况


按仓库 star 数排名



顶尖的贡献组织比较


  • 微软大约有 1,300 名员工积极地将代码推送到 GitHub 上的 825 个顶级仓库

  • 谷歌大约有 900 名员工活跃于 GitHub,将代码推送到约 1,100 个顶级仓库

  • 亚马逊大约有 134 名员工活跃于 GitHub,仅将代码推送到 158 个顶级仓库

  • 谷歌员工贡献的代码仓库比微软的多了 25%,存储卡获得的 star 数也更多(530,000 vs 60,000)。亚马逊仓库 2017 的 star 总数为 27,000。



亚马逊远远落后于微软和谷歌,那夹在它们之间有什么公司? 


根据贡献情况排名如下:RedHat,IBM,Pivotal,Intel 和 Facebook 也做出了突出贡献。



Facebook 和 IBM(US) 的 GitHub 用户数量与亚马逊的相似,但他们贡献的项目收获到了更多的 star(尤其是 Facebook):



紧接着的是 Alibaba, Uber, 和 Wix



GitHub,Apache 和 Tencent



Baidu, Apple 和 Mozilla



更详细的内容可直接参看这个可交互的版本:The top contributors to GitHub (2017)


怎么做到的?


1、数据来源:GitHub Archive


2、怎么判断 Github 用户属于哪个公司?


  • 这里主要通过用户提交记录中的邮件地址来进行判断。当然不是每个人都会用自己组织的邮箱地址,有很多人在 Github 上都选择如 gmail.com, users.noreply.github.com 或其他的邮箱,这种情况就没有办法了。


3、所用工具:Google Big Query


4. 具体的 SQL 代码(点击“阅读原文查看):




推荐阅读

将 Spring Boot 应用程序迁移到 Java 9:兼容性

思维导图,Eclipse 上提高效率的技巧

放弃 Python 转向 Go?有人给出了 9 大理由

区块链?人工智能?2018 年十大技术趋势

9 大跨平台移动 App 开发工具推荐

点击“阅读原文”查看更多精彩内容


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/lHqDiuNm1c
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/3929
 
430 次点击