社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

将微软、GitHub、OpenAI 告上法庭:索赔 647 亿元

云头条 • 1 年前 • 151 次点击  
程序员兼律师Matthew Butterick近日起诉了微软、GitHub、OpenAI,声称GitHub的Copilot违反了开源许可证的条款,还侵犯了广大程序员的合法权利。
GitHub Copilot于2022年6月发布,这是一款基于AI的编程辅助工具,使用OpenAI Codex在Visual Studio中生成实时源代码和功能推荐。
该工具使用来自公共代码存储库的数十亿行代码进行机器学习训练,可以将自然语言转换成数十种编程语言的代码片段。

薅创作者的羊毛

虽然Copilot可以加快编写代码的过程,并简化软件开发,但它使用公开的开源代码,这让专家们不由得担心它违反了许可归属和限制。
开源许可证(比如GPL、Apache和MIT许可证)要求注明作者的姓名和特定的版权。
然而,Copilot却在删除这个部分,甚至当代码片段超过150个字符且直接从训练集提取时,并不注明出处。
一些程序员甚至称这种做法为开源洗钱,这种做法造成的法律影响在这款AI工具推出后得到了证明。
在诉讼中代表Butterick的律师事务所Joseph Saveri声称:“微软似乎无视基础开源许可证的条件及其他法律要求,从别人的工作中获利。”
更为糟糕的是,有人声称Copilot错误地泄露了发布在公开代码存储库上的秘密内容,因而包含在训练集中,比如API密钥。
除了违反许可证外,Butterick还指控开发功能违反了以下法规或政策:
•GitHub的服务条款和隐私政策;
•禁止删除版权管理信息的DMCA 1202;
•《加利福尼亚州消费者隐私法》;
•以及引起相关法律主张的其他法律。
该投诉已提交到美国加州北区地方法院,要求法院批准90亿美元(646.65亿人民币)的法定损害赔偿金。
诉状写道:“每当Copilot提供非法输出,它就违反第1202条三次,即分发没有(1)注明出处,(2)版权通知,(3)许可条款的许可材料。”
“因此,如果每个用户在使用Copilot的整个过程中(早期用户使用Copilot最多长达15个月之久)只收到一个违反第1202条的输出,那么GitHub和OpenAI就违反了DMCA 360万次。每次违反的最低法定赔偿金为2500美元,换算后相当于90亿美元。”

伤害开源社区

Butterick在10月初的一篇博文中还提到了另一个话题,讨论了Copilot可能给开源社区带来的损害。
这名程序员认为,通过向人们提供代码片段,却从不告诉他们是谁创建了他们在使用的代码,促进开源贡献和合作的动机实际上荡然无存。
Butterick写道:“微软在搭建一个新的有围墙的花园,它将阻止程序员发现传统的开源社区。”
“久而久之,这个做法会使开源社区挨饿。用户的注意力和参与度将被转移,远离开源项目本身——远离他们的源代码库、问题跟踪器、邮件列表以及讨论板。”
Butterick担心,如果长此以往,Copilot会导致开源社区走向衰落,训练数据中的代码质量也会随之下降。
参考资料:https://www.bleepingcomputer.com/news/security/microsoft-sued-for-open-source-piracy-through-github-copilot/

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/149109
 
151 次点击