社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

AIGC平台侵权首案代理律师谈:AIGC定向学习边界与“主动避让”

网络法实务圈 • 3 月前 • 74 次点击  

人类的文学艺术创作不可能是凭空产生的,或者是对自然的模仿,或者是受已有作品的借鉴和启发,进入AIGC时代,用户拿起AI工具进行创作,也避免不了继续基于前人的作品或者风格提出指令,这就需要AI必须提前将已有的作品进行一定程度的学习,尤其是有较高知名度的IP内容,由此也必然导致一个非常严峻的知识产权问题,那就是机器定向的对特定IP进行学习,是否应该有一定的边界,尤其是对于知名的且仍然在法律保护期限内的IP内容是否有更高的注意义务,必要时是否应采取一定的措施对这些IP内容给予技术上的“回避”,这个话题很有必要深度思考。


一、AIGC定向学习的技术原理

以人工智能生成内容(AIGC)技术生成与某知名IP形象相似的新形象为例,我们可以详细解释这个过程:

选择目标IP:假设目标IP是“唐老鸭米老鼠”。这个角色有独特的外观、服装风格、语言习惯和故事背景。

n步骤1:数据收集与处理

内容抓取:系统会从各种可获得的资源中收集这个角色的图片、视频剪辑、动漫书籍、角色配音等。

数据清洗与标注:清除重复或质量低下的数据,对图片进行标注,如角色的不同表情、动作、场景等。

n步骤2:模型训练

选择合适的模型:对于图像生成,可能选择GAN(生成对抗网络)或变分自编码器等深度学习模型。

定向学习:对模型输入大量该角色的数据,特别是其视觉风格和表情。在训练过程中,模型会尝试学习并模仿这些特点。

n步骤3:内容生成

生成试验:输入特定提示或条件,如“生成该角色的新衣服设计”或“在不同背景下的角色形象”等。

迭代优化:生成的图像可能需要通过人工审核来进行选择和微调,以确保新生成的角色既保持原有的特色,又有新颖的创意。

n步骤4:优化与反馈

性能评估:通过与原角色的直观对比和用户反馈,评估新生成角色的相似度和创新性。

反馈循环:根据反馈调整模型参数或训练方法,改进未来的生成结果。

最终,AIGC系统可能创造出一个在造型、色彩和气质上与原始动漫角色相似但具有新元素或细节的角色。例如,保留原角色的经典发型和服装元素,但在色彩搭配、服饰细节或背景故事上进行创新和变化。

通过这个过程,AIGC不仅能够学习和模仿现有的IP内容,还能在此基础上进行创新和生成全新的作品。然而,这样的做法也涉及到训练数据来源、版权以及不正当竞争等多方面的考量和挑战。


二、AI技术中立要有边界吗?

事实上,从AI技术提供者的角度,这个话题必然关联到“技术中立”原则的适用范围。AI在文艺创作领域作为一项技术的“中立性”似乎是毋庸置疑的,直观看上去,用户才是技术的最终使用者,法律似乎应该让AI掌握最大限度的“实施能力”,包括对所有IP(不论是否还在法律保护期限)都可以学习和二次生成,只有这样才能够让用户拿到一个超级工具,至于这个工具如何使用以及对应的责任,理论上应当由用户负责。

这个观点在现实世界中可以找到最有力的理由应该就是,人也可以进行定向学习,一个画师的培养甚至可以说就是在通过不断的学习名家名作最终完成的,他学成之后,如果自行或者接受他人指令复现了一幅知名作品,那么他只需要因为这个复现的行为承担责任即可,此前学习的行为是不视为侵权的。

基于学习而使用现有作品在著作权法上通常被认为是合理使用,但在AIGC的场景下,基于大模型的机器学习会出现三个不同于人类学习的情况:

1. 大模型的学习效率极高,只要有一定数量的语料就能在极短时间内学会。一个人类画师需要十余年的学习才算专业水平,大模型一天就可以做到,学习效率的碾压导致大模型可以在极短时间内形成对人类创作者的冲击(十年寒窗,不如一朝学习);

2. 从效果上看,大模型学习能力远超一般人类,其通常可以做到逼近甚至超越原作者的效果;

3. 大模型一旦学习完成,就变成了通用技能,而且几乎可以无限制提供(算力的限制几乎没有上限),这意味着用户可以调用这种能力大规模生成同类型或者二次创作的作品,短时间内对人类手动创作作品形成“大水漫灌”式的稀释。

以上几个新情况是大模型技术出现以前,人类个体互相之间学习借鉴所没有遇到的,所以前面用个人学习与机器学习所进行的类比进而主张机器学习过程中的技术中立恐怕是难以成立的。

当然,这不代表着笔者认为要禁止所有的对受保护作品的学习,应当对具有一定知名度的作品和作者的定向学习进行限制。原因在于这些作品的原创度经过了市场检验,得到了公众的认可,是人类社会智力财富中的核心组成部分,对这部分成果的使用,技术提供者应当在训练时就具有事先注意义务,也就是本文标题中提出的“主动避让”。

(可以看到,chatgpt已经开始对知名IP适用“避让原则”,限制用户的生成指令)

而对于一般作者创作的作品,并不是说机器就可以以“合理使用”等为由“任意”学习,而是可以放宽AIGC技术提供者的注意义务,可以以事后救济的方式,即可以在不知情的情况下先训练,以便最大限度提升技术水平,而一旦权利人发现机器将这种定向模仿的能力定向使用,导致自身作品被稀释或者混淆,这种情况下可以发起投诉,由技术提供者采取必要措施。


三、“回避原则”的法经济分析

AIGC对有知名度的IP形象进行针对性的学习训练,然后可以根据用户指令生成近似或者修改后的形象,这种做法会造成对IP方的损害,从经济学的角度看,如果不对此类行为进行规制可能导致的多方面的不利后果:

1. 对IP权利人的影响

  • 品牌稀释:AIGC生成与知名IP相似的内容,可能导致市场上出现大量类似的产品或内容,从而稀释原有品牌的独特性和价值。

  • 收入减少:如果AIGC生成的内容替代了原IP的消费,这可能会直接影响到原IP权利人的销售和利润。

  • 投资回报降低:知名IP的创作和维护需要巨大的投资。AIGC的定向学习和生成可能降低原创内容的独特性,进而影响投资者对原创内容的投资意愿和回报预期。

  • 损害创新激励:如果AIGC生成的内容轻易地替代了原创内容,这可能会减少对原创IP的投资和开发,从而抑制创新和多样性的发展。

2. 对用户的影响

市场失效:在没有适当规制的情况下,AIGC可能会导致市场饱和,消费者难以区分原创和AI生成的内容,从而造成市场效率下降和消费者福利损失。

  • 价值转移:AIGC技术可能使价值从原IP权利人转移到技术提供者,特别是当技术提供者使用这些生成内容盈利而不进行合理分成时。这不仅影响IP权利人的经济利益,还可能导致整个创意生态的价值链重构。

  • 质量下降和同质化:在缺乏规制的环境下,为了追求成本效益,市场可能会充斥大量低质量和高度同质化的内容,这会破坏消费者体验,降低整体文化质量。

如果不对已有IP进行一定程度的“避让”,则创作者和用户参与文化艺术市场的热情都会逐渐降低,AI就像一个虎视眈眈的“IP吞金兽”,把最有创造性的人类从市场上逐渐驱逐出去,这样做短期内可能对技术提供者有利(可以不支付学习成本),但长期而言,AI也会因为脱离了人的参与积极性而陷入“语料荒漠”,除非有一天AI完全可以在文学艺术领域自己与自己“左右互搏”式的学习,彻底摆脱人类,否则AI技术提供方仍然应该有长远眼光,设计出多方共赢的机制。


四、规则层面可以做什么

除了市场自发的互相制约,法律在构建人机协作内容生成生态的过程中也不可缺席,应该制定出科学合理的规则,降低交易成本,推动技术威力的释放,并且让社会整体获得收益。

为解决AIGC定向学习对IP权利的潜在影响,可以从规则层面进行一系列调整,以平衡创新推动与知识产权保护之间的关系。以下是笔者的一些解决方案构想:

1. 立法对AIGC技术提供者提出“主动避让”义务。

对具有较高知名度的作品应该在训练阶段或者生成阶段进行“避让”,类似“红旗原则”。但二者有所区别,“红旗原则”适用于用户上传信息到平台的场景,而“主动避让”则是AI技术提供者直接进行数据训练和内容提供的场景,后者作为行为的直接实施者,其注意义务应该更高。

2. 明确AIGC生成内容的权利归属和侵权构成。

当前的AIGC生成内容是否可以获得法律保护仍然是一个极具争议的问题,笔者在之前的文章中已经提出了解决方案,应当尽快对部分AIGC作品赋予版权保护,也只有这样,这类作品一旦构成侵权,权利人才能够主张对作品享有权利的作者进行维权。

3. 引入AIGC训练数据集体管理机制

类似于音著协、影著协的做法,通过训练数据集体管理组织来协调利益分配,确保IP权利人的作品等数据用于AI训练时得到公正的补偿。同时可以借助协会的力量统一开发授权和追踪系统:发展先进的技术解决方案来跟踪和管理AIGC内容的使用情况,确保透明和可追溯的授权流程。

4. 设立标准和指南

在AI如此迅猛的发展势头之下,立法一定会更加之后,标准大显身手的时代来了,应当围绕AIGC的著作权保护标准、数据训练标准、AIGC平台规范标准等问题尽快制定非强制性标准,让业界有章可循,引导从业者向着健康良性的轨道发展,过程中不断对新的、好的做法进行借鉴,有些不适合做标准的,可以由企业、协会、专业机构等牵头制定指南。

通过上述措施的实施,我们不仅可以保护IP权利人的合法利益,还可以维护市场的正常运作和促进整个社会的创新与繁荣。这是一个需要立法机构、技术提供者、IP权利人以及消费者共同参与的过程。各界一起努力,为AIGC技术的健康发展和知识产权的有效保护携手创造一个更加公平、合理、透明的未来。


— END —

文章投稿联系

作者|张延来

浙江垦丁律师事务所 创始人 主任律师 专利代理人

「网络法学社」及「网络法实务圈」创始人

中国政法大学法学院实务导师

西南政法大学人工智能法学院实务导师

浙江省反垄断专家指导委员会委员

杭州市律师协会理事

杭州仲裁委员会仲裁员


执业以来完全专注于互联网法律实务工作,担任数十家头部网络公司常年法律顾问,并代理《胖虎》NFT侵权第一案、群控第一案、微信小程序第一案、智能手机刷机第一案、5G云游戏第一案、人脸识别第一案等多个标杆涉网诉讼案件,代理的案例分别入选“最高院十大知产典型案件”、“最高院五十大知产典型案件”、“中国最具研究价值知识产权案件”、“中国十大宪法事例”等。深度参与中国《电子商务法》、工商总局《网络交易管理办法》、杭州市《网络交易管理办法》的立法工作。个人专著《法眼电商》、《网络法战地笔记》、《无技术不法律》已分别由法律出版社、法制出版社出版。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/167399
 
74 次点击