社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

涉图片侵权、错误信息诽谤等,AIGC将迎来侵权潮?

互联网er的早读课 • 2 年前 • 331 次点击  
一直以来,关于AI是否侵权的相关话题的讨论就没有停止。而自从ChatGPT打开了生成式AI(AIGC)新大门,AI侵权的风险被进一步放大。
相比于ChatGPT此类的文字大模型,AI绘画似乎存在更大的争议,已经有图库公司和个人发起侵权起诉,还有国内原创平台推出AI绘画惹得不少画手删号退出。

一、ChatGPT侵权争议不断,法学教授莫名成“性骚扰者”,程序员指控代码被侵权,美国新闻集团拟发起版权诉讼

随着ChatGPT的爆火,对于其信息泄露和侵权的质疑在不断加强。目前意大利已经禁用ChatGPT,德国、法国、爱尔兰等国家已开始准备效仿意大利的做法,加强对ChatGPT的监管。

4月4日,加拿大隐私专员办公室(OPC)宣布对聊天机器人ChatGPT开发公司OpenAI展开调查,该调查涉及“OpenAI未经同意收集、使用和披露个人信息”的指控。

此外, 不少企业也开始限制在业务运营中使用ChatGPT以防止信息泄露。

这些国家对ChatGPT的谨慎态度不是毫无道理的。ChatGPT这样的文字大模型需要大量的训练数据,而这些数据很多都来自公开信息。尽管ChatGPT会对信息进行再加工,但是否侵权这还是个争议话题。

2022年11月,GitHub、微软和OpenAI在一起侵权案中被起诉,程序员指控一款名为GitHub Copilot的AI编程工具抄袭代码。

据了解,这场诉讼的法庭听证会将在今年5月举行。

事实上,已有美国新闻媒体机构对AI使用自己的内容感到不满。据报道,拥有《纽约邮报》、《巴伦周刊》、《华尔街日报》等的美国新闻集团正准备向 OpenAI、微软和谷歌等公司提起诉讼,要求赔偿其内容在ChatGPT、Bard等AI工具中被用来使用的费用。

一位《华尔街日报》的记者曾展示了训练ChatGPT的一份新闻来源清单,路透、纽约时报、卫报,BBC新闻、彭博等一些国际主流媒体均在其中。


AIGC的另外一个侵权隐患就是错误信息,ChatGPT扯起谎来有时逼真的令人惊讶。

今年2月份,一则“杭州3月1号取消限行”的消息流传开来,让不少人信以为真。最后杭州警方证实消息不实,系某人用ChatGPT写的假新闻。

这种虚假信息主要责任还是造假者,但有时AI本身就会数据虚假信息,这也有侵权隐患。

比如,近日一位乔治·华盛顿大学法学院教授就莫名成了“性骚扰者”。据报道,ChatGPT生成的一份“有性骚扰历史的法学学者”名单中,这位教授就在其中。

还有英国《卫报》的一位记者称,ChatGPT杜撰了一篇他署名的文章,文章风格和他很相似,足以以假乱真,但他本人经过确认并没有写过这篇文章。

另据报道,澳大利亚一位市长准备起诉ChatGPT的所有者openAI,因为ChatGPT在介绍这位市长时,称其卷入到了一场贿赂丑闻中,还称其有罪。这位市长已向openAI发出法律信函,要求对方修正错误表述,否则将面临诽谤诉讼。

最近国内也上线了不少类ChatGPT大模型,也爆出不少让人匪夷所思的错误回答。


二、AI绘画领域最大侵权案出现,Stability AI被起诉,或涉及数百万版权图片

去年8月份Stable Diffusion向用户免费提供掀起了AI作画的热潮。Midjourney、DALL·E 2、Imagen等热门AI作画平台也都诞生于2022年,可谓AI作画元年。

AI作画的作品到底有没有版权,这是个问题。

去年9月,艺术家卡什塔诺娃为自己的漫画书《黎明的曙光》申请版权保护,但没有透露书中的插图由AI创作。


今年2月,美国版权局做出裁决称,漫画书中的文本仍受版权保护,但由AI作画工具Midjourney创作的插图不受版权保护。

对于创作者来说,AI作画有潜在的版权风险。

此外,AI作画工具能力的提升也是基于大量的图像库进行训练,其实有一定侵权的隐患。

比如图像库中涉及到有版权的图像,而用户生成的图片恰好显示了上述图像的显著部分,这可能涉及到侵权。

有报道指出,Stable Diffusion生成的一些图像似乎带有水印,这表明它的原始训练数据集中可能有一部分图像是受版权保护的。

为了避免版权问题,Getty Images、Shutterstock等知名付费图库纷纷封禁AI生成图片,停止接收所有由Stable Diffusion、DALL·E 2、Midjourney等AI模型生成的画作。

同样,AI作画工具也受到不少画师的抵制,其一是有些人认为AI在免费用他们的作品作为训练数据,还有人认为AI模仿了自己的作画风格,也是一种侵权行为。

去年底知名视觉艺术网站Artstation就发生了用户集体抵制AI的事件,当时引起了广泛关注。


最近,网易图片社区LOFTER上线AI绘画功能,就遭到用户的抵制,担心平台会把自己的画作当做训练数据。

对此,LOFTER两度发布声明称,该功能的训练数据集来自于开源数据,未使用用户作品,并表示始终尊重并保护创作者的知识产权。

但画手们似乎并不满意,不少人发文抵制,甚至有人删号退出平台。3月8日,LOFTER最终下线了该功能。


事实上,今年1月份国外已有三位艺术家状告Stability AI以及Midjourney,侵犯诉讼艺术家的版权。

艺术家指出这些AI工具训练数据涉及到了上亿张受版权保护的图像,他们把AI作画工具称为“侵犯艺术家权利的21世纪拼贴工具”。
除了艺术家,全球知名的图库商Getty Images起诉了AI作画工具的老大哥Stability AI。

Getty Images称Stability AI非法复制和处理了数百万受版权保护的图像”,以此训练名下的Stable Difussion。

Getty Images还展示了多张Stability AI的生成图片,图片上赫然地带有自家的logo。

注:左侧为图库原图,右侧为AI作图

还有就是AI作画工具的滥用也可能存在侵权风险,比如下面这种:


三、AIGC版权将在争议中完善

无论是图像还是文字大模型,其实都有不少版权相关的风险隐患。

作为AI作画工具平台方,训练数据可能侵犯他人的版权,比如新闻机构、图库商,内容也可能存在失真情况。

而作为普通使用者,首先创作的内容的版权很难得以保证,目前规则也比较模糊,到底怎样的AI创作才拥有版权还待清晰的规则。

其次,普通使用者也可能制作的内容可能侵犯他人的权利或违规违法,比如虚假新闻、丑化图像。

对于艺术家等专业内容创作者来说,自己的半成品存在被窃取的风险,同时个人风格也容易失去独特性,如何保证自己的利益将变得困难。

对于个人创作者来说,很难像Getty Images这样的图库机构能够找到侵权的确切证据,毕竟AI是经过加工处理的,这也是生成式AI的最大特点,越成熟的平台也是如此。

笔者尝试测试了Midjourney、DALL·E 2、文心一言等AI平台,确实很难发现生成的内容是否与现实作品有多大关联。

但对于弱小的个人创作者,又如何维护自己的版权,而不是在不知不觉间成为AI的训练数据,这也是个问题。

这一切都要求AIGC版权规则的进一步完善。事实上,生成式AI是从2022年才开始爆火,时间还很短,但是我们一系列争议和诉讼中也要看到积极的一面,这些都是促使AI版权完善的重要途径。



 | 三言ProID:sycaijing

作者 | 三言;编辑 | 时刻



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153526
 
331 次点击