Py学习  »  Git

GitHub 超过半数是重复代码

技术最前线 • 6 年前 • 492 次点击  

(点击上方蓝字,快速关注我们)


转自:Solidot

http://www.solidot.org/story?sid=54614


GitHub 的一个使命是共享代码,所以发现其平台上重复代码比例高达七成并不是令人吃惊的事情。


8 名研究人员组成的国际团队原计划并不是测量 GitHub 上的重复代码,而是调查不同克隆库之间的文件差异,结果发现了惊人比例的文件级复制,因而改变了研究方向。


研究人员发现,GitHub 上 4.28 亿文件中只有 8500 万是唯一的。研究报告发表在 OOPSLA SPLASH 会议上。



  • JavaScript 是克隆最多的环境,94% 的 JavaScript 文件是复制的;

  • 73% 的 C++ 文件是重复的,

  • 而 Python 程序则是 71%

  • Java 是其中最独特的,但重复比例也达到了 40%


英文全文:https://www.theregister.co.uk/2017/11/21/github_duplicate_code/

报告全文:https://dl.acm.org/citation.cfm?doid=3152284.3133908&preflayout=flat



觉得这条资讯有帮助?请转发给更多人

关注 技术最前线 看 IT 要闻

淘口令复制以下红色内容,再打开手淘即可购买

范品社,使用¥极客T恤¥抢先预览(长按复制整段文案,打开手机淘宝即可进入活动内容)


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/kdXV228gQN
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/4292
 
492 次点击