社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!

新智元 • 2 年前 • 277 次点击  



  新智元报道  

来源:Reddit

编辑:好困

【新智元导读】抄袭可耻,但AI可以?刚发布的Copilot就被推上了「侵权」的风口浪尖!网友表示:你再训练都是基于我们的开源代码,这改一改就想用来赚钱真的好么?


Github和OpenAI联合发布的AI代码生成工具——Copilot,看起来简直就编(mo)程(yu)神器。

 

Copilot不仅能依据程序员写的几行注释生成对应的代码,而且还可以根据代码的上下文自动补全整段函数。

 

在1750亿个参数的GPT-3语言模型的加持下,其核心Codex模型接受了来自GitHub的数十亿行开源代码的训练。

 

 

显然,Copilot的效果十分理想,用过的人都对其大加赞赏。

 

「Copilot似乎确切地知道我接下来要输入的内容,而且Copilot在处理React组件时特别有用,它可以做出非常准确的预测。」

 

 

GitHub的CEO Nat Friedman也非常兴奋地表示:「每天都有数百名GitHub的开发者在使用Copilot,如果预览版进展顺利的话,我们将计划在未来某个时候将其扩展为付费产品。」

 

等一下,GitHub这是把开源的代码一波操作之后变成「付费」的产品?

 

 

网友们一下子炸了,看这架势是要无视General Public License

 

「他们自己承认,Github Copilot接受了大量GPL(通用公共许可证)代码的训练,这难道不是一种将开源代码清洗为商业产品的形式么。『它通常不会重现精确的代码』这个声明很难令人满意。」

 

 

GPL——通用公共许可证是什么?

 

根据维基百科的解释,GNU General Public License,中文翻译为通用公共许可证,简称GPL,是一系列自由软件许可证,可保证用户运行、研究、共享和修改软件的自由。 

 

同时,GPL是一个Copyleft许可证,这意味着任何衍生作品都必须遵循相同或等效的许可条款

 

GNU官网对于GPL的解释说,如果你想把修改过的GPL代码向公众发布,就需要提供源代码

 

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

 

GPL许可证系列一直是开源软件领域中最受欢迎的软件许可证之一。其中就有大名鼎鼎的Linux内核。 

 

对于Linux的成功,GPL在其中也扮演了至关重要的位置,它证了为内核做出贡献的程序员的工作保持自由,而不是被他人利用。

 

而Copilot用基于GPL的代码进行训练这件事,网友概括道:「GPL明确声明『不要将我的工作放在专利软件中』,而Copilot则是一种将他们的工作放在专利软件中的机制。」

 

 

有网友表示不解:「为什么这是一个问题?GPL不是说可以自由地共享和修改代码?」

 

「是的,GPL允许共享和修改代码但必须将其作为GPL发布。」

 

 

也有网友表示:「你怎么知道『你想出来』的代码不是源自GPL的代码?」

 

 

「但是,人类也通过阅读开源代码来学习,所以这不是一回事么?」

 

「不,人类具有抽象的理解能力,并有广泛的知识可供借鉴,而统计模型没有。」

 

 

「人类开发人员在大量封闭和开源项目上进行训练,并反刍他们作为片段藏起来的代码,是在创作衍生作品吗?」

 

「呃,是的,如果你『隐藏』了GPL代码的片段,然后将其复制粘贴到商业项目中,这听起来就像是在违反许可。」

 

 

难道真能用别人的代码赚钱?


针对把别人的代码商用化这件事,甲骨文对谷歌侵权的诉讼可以说是一个非常著名的案例了。

 

其中的争议集中在Java的部分API11,000行源代码的使用上,这些源代码归甲骨文所有,而谷歌则把它们用在早期的安卓操作系统上。

 

 

甲骨文提起诉讼,称这些API是受版权保护的,要求谷歌从侵权的安卓版本的销售和许可中获得88亿美元的损害赔偿。

 

虽然两次地区法院级别的陪审团审判都支持谷歌,但联邦巡回法院推翻了这两项决定,声称 API受版权保护,并且谷歌的使用不属于合理使用。

 

谷歌在2019年的任期内成功向最高法院申请审理此案,重点关注API的版权和后续合理使用。2021年4月,最高法院以6比2的裁决裁定谷歌对Java API的使用属于合理使用。该决定推翻了联邦巡回法院的裁决,并将案件发回重审。

 

网友调侃道:「在谷歌的某个地方:『我们有 0.1% 的机会从甲骨文中逐字复制一小块代码,我们应该使用它吗?』」

 

 

反方观点


被视为一个受版权保护『作品』的『衍生作品』,必须包括原始作品的『实质性』部分。而Copilot自动生成的5行函数 不会被法律领域的任何人视为『衍生作品』。」



对于AI学习了开源代码之后,重新组装并复用它们,而背后的公司则用这个AI去赚钱,你怎么看?



参考资料:

https://www.reddit.com/r/programming/comments/oaxyxu/github_copilot_as_open_source_code_laundering/

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/116486
 
277 次点击