Py学习  »  aigc

研究人员提出版权授权方案,能将艺术家风格和IP版权授权给AIGC模型

DeepTech深科技 • 1 年前 • 379 次点击  


生成式人工智能极大地改变了人类生活。与此同时,由于这类大模型的训练需要非常巨大的训练数据,不可避免地会使用到人类创作者的未授权数据。

比如说在图像生成领域,像 Stable Diffusion 和 Midjourney 可以很好地复刻一些艺术风格。虽然,目前对这种复刻能力是否构成侵权还没有定论。从艺术创作者的角度来看,这显然侵害了他们的利益。

某种程度上说,创作者的艺术创作能力被大模型“偷窃”,而且还让艺术创作赛道越来越卷。这甚至有可能会危害到小型艺术创作者的生存。

同样的,从长远来看,由于人类创作者的生存空间被压缩,很难会再有新的高质量数据来帮助大模型进一步成长,这也不利于大模型的发展。

那大模型服务商向人类创作者购买授权,能够解决大模型与人类创作者之间的矛盾吗?

这也是不太现实的。因为人类创作的数据很难进行定价。《纽约时报》和 OpenAI 的诉讼官司中有提到《纽约时报》曾经协商过出售数据,但是最后也没能达成一致。

主要原因是大模型服务商关注数据的通用性,很难为这些人类创作者的风格支付足够的价钱。一个现实合理的方案是模型使用者向人类创作者购买授权。

近日,中国科学技术大学、北京大学与微软亚洲研究院团队所合作提出的生成式人工智能时代下的“版权授权”方案,为解决该类问题提供了方法。

研究人员表示:“我们此次研究的背景是源自于网上冲浪的时候,看到很多艺术家社区呼吁抵制文字生成图像模型,因为模型剽窃能力太强了,人类创作者创作效率跟不上。”

网络上有言论说:生成式人工智能是新的工业革命,像把马车夫转变成汽车司机一样,要把用笔创造艺术的艺术工作者们变成用模型创造艺术。

该团队认为,生成式模型实质上就是对数据的一种压缩,很难像人类创作者一样有自我的表达。

所以他们想设计一套方法,能够在生成式人工智能时代保护好人类创作者的利益,也能够有源源不断的人类艺术产生。

而他们所设计的方法,在模型的生成能力不受很大影响的情况下,将模型生成特定风格的能力打包成插件,供模型使用者购买使用。

尽管单纯地在生成式模型上添加特定风格已经被解决得很好,但他们更多关注的是已经被生成式模型学会的风格,即把这部分被耦合进基础模型的风格生成能力重新提取出来。

此外,如何让多个插件不冲突,也是需要考虑的问题。打个比方,如果想在一幅画里面同时生成奥特曼和米老鼠,可能需要同时用到两个插件,如何让它们能够同时生效,也是本次工作的一个贡献。

对于相关论文,审稿人认为他们所提出的“版权授权”问题和解决方案非常有趣且重要。

并指出此次提出的框架,为图像生成领域的版权问题提供了一个整体解决方案,使得版权归属和灵活授权成为了可能。

通过相关实验,该团队实现了艺术家风格的复刻和 IP 的重造,验证了本次技术的可行性。

(来源:arXiv

总的来说,尽管生成式人工智能已经极大地方便了人类生活,但是本次技术实质上是对其之前“野蛮发展”时期的侵权行为做补救措施。

未来,预计会诞生有利于低成本构建安全合规的生成式人工智能。当然,也有利于 characterAI、Civital 等生成式人工智能平台的发展。

日前,相关论文以《©文本到图像模型中用于保护人类内容版权的插件授权》(©Plug-in Authorization for Human Content Copyright Protection in Text-to-Image Model)为题发在 arXiv[1]。

图 | 相关论文(来源:arXiv

论文一作中国科大周潮同学表示:“此次论文算是我的科研处女作。由于研究方向比较热门比较卷,很容易撞车。导师就鼓励我,做研究先要看方法能不能解决问题,而不应该过分关注方法的创新点,过度地避开前人的方法。”

不同人考虑问题肯定会不一样,一味地避开别人,会把自己思路束缚住,不利于科研工作的开展。

图 | 周潮(来源:周潮)

当然,本次技术还存在改进空间,在如何避免多个插件冲突的问题上,审稿人给了很多建议,他们也会参考进行改进。

此外,他们目前只做了文字到图像的生成模型,未来随着文字到视频的模型的成熟,也会存在这个问题。

因此,他们也将关注视频生成模型的版权保护问题。研究人员补充称,生成式人工智能的版权保护问题从科学研究的角度可以归结到隐私与安全上。

从隐私与安全的角度上说,就是要思考如何去除掉这部分版权数据、或者不让这部分版权数据暴露。

他们认为生成式人工智能的隐私与安全问题随着生成式人工智能的发展会愈发重要,因此非常值得开展研究。

参考资料:

1.https://arxiv.org/pdf/2404.11962


排版:溪树




01/ MIT团队揭晓雷特综合症新机制,建立全基因组表观遗传学图谱,相关神经元数据库已开源


02/ 科学家提出纯机械计算机新理论,提升有限机械系统的运算能力,为智能超材料开辟新思路


03/ 孙立成院士团队开发新型阴离子交换膜,大电流下稳定运行2400多小时,或大幅度降低制氢成本


04/ 澄清170多年学术争论:北大团队获得六角冰表面原子级分辨图像,刷新对于冰表面的传统认知


05/ 科学家研发种子筛选AI模型,预测准确性超过90%,实现高效数字化的抗病品种筛选

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/171553