王迁等｜人工智能生成的内容（AIGC）受著作权法保护吗

人工智能生成的内容（AIGC）受著作权法保护吗

朱阁、崔国斌、王迁、张湖月

参与本次对话的有来自北京互联网法院审理“AI文生图”著作权案的朱阁法官、清华大学的崔国斌教授、华东政法大学的王迁教授、香港大学的张湖月副教授等。限篇幅原因，本文仅摘录我校王迁教授部分。

本文原载自《中国法律评论》2024年第3期“对话”栏目（第1-28页），感谢授权，引用请以刊发版本为准！

对话要目

AIGC的作品属性：

第一，在我国，何为传统的“作品”的认定条件？

第二，如何理解AIGC与作品认定要件中“独创性”的关系？

第三，AIGC是否要专属于文学、艺术和科学领域才可能具有作品属性？

第四，AIGC是否改变了“思想-表达”二分法？

AI技术开发者在AIGC中的贡献认定与保护：

第一，如何认定AI技术在AIGC中的贡献？

第二，如何理解AI技术与作品认定要件中“独创性”的关系？

第三，著作权法支持AI开发者对AIGC内容的版权或类似保护的主张，会对生成式人工智能产业发展产生何种影响？

第四，如果AI开发者不能获得对人工智能生成内容的著作权保护，那么，其能从生成式人工智能的研发中获得经济回报吗？法律又应该如何保护AI开发者的合法权益？

用户在AIGC中的贡献认定与保护：

第一，用户在使用生成式人工智能的过程中是否有可能作出独创性贡献？

第二，如何认定用户对AIGC的智力贡献进而认定AIGC的作品属性？

第三，著作权法保护或不保护AIGC，会对用户使用AI的行为产生什么影响？

第四，在创作过程中，用户与生成式人工智能的互动过程，与传统的雇主—雇员、委托人—受托人、教师—学生之间的互动相比，有可比性吗？

第五，著作权法保护或不保护AIGC，会对AIGC内容生态产生什么影响？

第六，法律应当采取何种方案来保护用户贡献？

关于AIGC未来可能的法律制度设计

中法评：就AIGC的作品属性而言，需要解决以下四个问题：其一，在我国，何为传统的“作品”的认定条件；其二，如何理解AIGC与作品认定要件中“独创性”的关系；其三，AIGC是否要专属于文学、艺术和科学领域才可能具有作品属性？其四，AIGC是否改变了“思想-表达”二分法？

王迁：就哪项要件是决定AIGC成为著作权法意义上作品的关键，我有不同意见。具备独创性当然是构成作品的必要条件。然而需要强调的是，只有著作权法意义上的表达才有判断独创性的价值。如果某人作出的智力贡献属于“思想和表达两分法”中的思想，那么根本无须讨论独创性问题。换言之，脱离“思想和表达两分法”去讨论独创性，包括讨论一种成果是否为智力成果，是否体现了智力投入，都是没有意义的，因为不受保护的思想当然可以是高度“独创”的，是智力成果，体现了智力投入。

例如，在爱因斯坦提出广义相对论之前，没有人能想到时空是弯曲的，光在宇宙中走的并不是直线，而是受引力影响形成的曲线。爱因斯坦广义相对论的独创性可谓毋庸置疑。然而，类似于相对论这样的思想并不可能因其属于具备独创性，甚至是具备高度独创性的智力成果就能作为作品受著作权法的保护，因为再有创意和价值的思想都必须在著作权法中留在公有领域。

由此可见，在讨论AI生成的内容是否应具备独创性而被认定为作品之前，必须要解决一个前提问题，那就是该内容是否为人类贡献的表达？该问题的另一种表述就是，该内容是否为人类的创作行为所形成的？这两个问题之所以是等效的，是因为著作权法意义上的创作，必须是直接形成构成作品的表达性要素的行为。如果某人贡献出的成果不属于著作权法意义上的表达，那就意味着他没有实施著作权法意义上的创作行为。

此时去讨论该成果的独创性问题，包括该成果是否为智力成果，独创性的要求是“有无”还是“程度”，都是没有意义的。因此，爱因斯坦贡献出的广义相对论，作为一种理论体系，是不受著作权法保护的思想；而他通过思考形成该体系的过程也不能被认为是著作权法上的创作。只有当爱因斯坦或其他人以文字形式将其思想体系呈现出来时，比如爱因斯坦那篇著名的论文《论运动物体的电动力学》以及奥地利物理学家泡利（Pauli）那长达237页的相对论综述，才能被认为是著作权法意义上的表达，此时去讨论独创性才有意义。

需要指出的是，《著作权法实施条例》第3条规定：“著作权法所称创作，是指直接产生文学、艺术和科学作品的智力活动。”其中的“直接产生”强调的正是人基于自由意志直接决定构成作品的表达性要素。这里的“直接产生”并非指百分之百决定，它当然可以包括一些他人的贡献（如编辑对来稿的文字调整）和一些偶然因素（如作画时画笔意外偏离原定轨迹而产生的效果），但人的自由意志必须占主导性、决定性的地位。

如果表达性要素并不由人的自由意志直接决定，那么即使其“体现了此人的独创性贡献”，也不能说此人对其实施了创作行为，并认定此人为著作权法上的作者。对于上文提及的泡利长达237页的相对论综述而言，每一个句子都能“体现爱因斯坦的独创性贡献”。如果没有爱因斯坦贡献出的具有高度独创性的相对论，哪里还有相对论综述呢？然而，能就此认为泡利撰写的相对论综述就是爱因斯坦的作品吗？显然不能。

崔国斌教授提出“在演绎作品中，很多表达细节就并非直接来源于演绎者，而是原作者。这并不妨碍我们将演绎行为视为‘直接产生……作品’的创作行为”，以此论证哪怕是不直接源于本人的表达，也可以构成“创作”。

然而，在演绎作品的创作中，演绎者的“创作”指向的也是源于其本人的、有别于原作品的表达性要素。因为演绎者基于自由意志能够直接决定的，并不是构成原作品的表达性要素，而是以原作品为基础通过发展原作品的表达而产生的新的表达性要素。演绎者不可能对原作品的表达性要素主张权利。例如，翻译者将以西班牙语写成的小说《百年孤独》翻译成中文，当然就成为翻译作品的作者，享有翻译作品的著作权。但翻译者不可能对马尔克斯创作的原作，包括其独创性的情节设计享有任何权利。

崔国斌教授所述的“在演绎作品中（的）很多表达细节”应当是指类似于《百年孤独》中的故事细节，然而《百年孤独》的翻译者并没有创作出这样的“表达细节”，其创作的（“直接产生的”）是中文的文字组合、遣词造句。翻译者也只能对该文字组合、遣词造句享有权利。这就是为什么要出版《百年孤独》的中文版，不能仅取得翻译者的许可，还要取得原著著作权人的许可。

同样道理，要解决AI生成的内容是否属于作品的问题，首先要考虑的也不是研发者或者用户做出的贡献（许多情况下体现了智力投入）是否具备独创性、研发者或者用户的独创性贡献是否体现到了人工智能生成的内容中，以及是否能在形式意义上称该内容为“智能成果”，而是这种贡献相对于人工智能生成的内容而言，是否属于思想，也就是人工智能生成的内容作为形式意义上的“表达”，是否源于研发者或者用户的创作行为。

此前法院认定中超赛事直播画面（而不是赛事本身）、长度仅为13秒的以“汶川大地震”灾后重建为主题的短视频，以及微信红包的开启动画构成作品，其前提都是人基于自由意志直接决定了视听作品的基本表达要素。因此，其中判决的争点（如笔者不赞同中超赛事直播案的再审判决）也仅集中在相关成果是否符合独创性及其他作品认定要件（如视听作品必须被“固定”在物质载体上），而不在于这些成果是否由人的自由意志所直接产生。

与之相反，“AI文生图”著作权案并不是对前述司法判决思路的延续，而是从根本上颠覆了作品认定的基本原则。显而易见的事实是，“生成式人工智能”之所以得名，正是因为此种AI可以根据其独特的算法和所受的数据训练，自行生成五花八门的内容。无论是设计算法和训练人工智能的研发者，还是输入提示词的用户，都不可能决定生成式人工智能自行产生的形式上接近于人类作品的内容。

“人输入的提示词决定了AI生成的内容”这一观点与客观事实相去甚远。有兴趣的读者可以自行做一个简单的实验，那就是将相同的提示词输入不同的生成式人工智能（比如四款国产生成式人工智能绘图程序：百度公司开发的“文心一言”、腾讯公司开发的“混元”、阿里云公司开发的“通义万相”和字节跳动公司开发的“豆包”），观察不同的AI生成的内容是否相同。事实上，不同的生成式人工智能根据相同的提示词生成的内容会有极大的差异。

这就说明用户的提示词只能影响生成式人工智能所生成内容的主题和风格等，但是无法决定表达性要素，比如文字内容的文字组合、遣词造句和图形内容的具体构图。因此，即使用户的提示词在复杂到一定程度的情况下本身可以构成文字作品（比如一位诗人为了让生成式人工智能“文生图”而创作了一首诗歌，并将该诗歌作为提示词输入生成式人工智能，用作提示词的诗歌本身当然是受保护的作品），该提示词相对于生成式人工智能所产生的内容而言，仍然是思想。此时去讨论用户的提示词是否具有独创性是没有意义的。

与此同时，著作权法当然不会要求作品必须通过人嘴或人手直接输出，而是允许通过工具来实施创作行为，实现自由意志所决定的构成作品的表达性要素。然而，著作权法意义上的创作工具只能是实现创作者自由意志所决定作品的表达性要素的消极工具，而不能实质性地参与作品表达性要素的决策过程。

试问，人们所普遍承认的创作工具，从早期的纸、笔到现在的照相机、文字处理软件如Microsoft Word和WPS，以及绘图软件Photoshop，哪一个自行决定了构成作品的表达性要素？如果同一位作家先后使用Microsoft Word和WPS输入了相同的文字，这两款文字处理软件却都生成了与作家的输入截然不同的文字组合、遣词造句，它们还能被称为是作家的“创作工具”吗？

如果一位摄影师在对拍摄对象、拍摄角度、焦距、光线和拍摄时机等一切影响影像内容的因素作出了完全相同的选择和判断的情况下，分别用两个不同品牌的照相机或智能手机拍照，得到的两张照片在影像内容上都与摄影师通过取景框和上述选择判断而决定的影像内容相去甚远，且相互之间也差异极大，这两款照相机或智能手机还能被视为“创作工具”吗？

“只要人的智力投入能够‘影响’最终获得的内容，就认为该内容是此人创作的作品”这一命题，不仅与《著作权法实施条例》对“创作”的定义——“直接产生文学、艺术和科学作品的智力活动”不符，也会导致极其不合理的结果。试问，美术老师向全班三十名同学发出细致、具体且具有创意的绘画要求，该要求能不能影响三十名同学绘画的内容？回答当然是肯定的。然而，能就此认为这三十名同学完成的三十幅绘画就是这名美术老师所创作的作品吗？显然不能。

因此，否认用户以生成式人工智能为“创作工具”创作出了作品，并不是因为用户和最终生成的内容之间“隔着”生成式人工智能，而是因为用户的贡献（包括智力贡献）不能决定构成内容的表达性要素。当用户用Microsoft Word或者WPS撰写小说时，用户和存储在计算机硬盘中的小说之间也“隔着”计算机和文字处理软件，但是没有人会否认用户的行为直接产生了文字作品。

此外，笔者从未主张过“直接产生……作品”就是指百分之百地决定构成作品的每一个细节。在《再论人工智能生成的内容在著作权法中的定性》一文中，笔者有如下表述：“‘直接产生……作品’要求民事主体基于其自由意志决定构成作品的表达性要素，但这里的‘决定’并非局限于百分之百地确定作品中的每一处细节，而是可以留下容纳其他来源贡献的空间。只是其他来源的贡献不属于实质地改变或发展作品的表达，从而不能被认为构成‘创作’。”而AI生成的内容，实质上是由AI的算法和所受训练决定的，不是人的“创作”。

在生成式人工智能的用户并没有通过输入提示词实施创作行为的情况下，不但讨论由此生成的内容是否具有独创性、是否体现了用户的智力投入没有意义，讨论该内容是否处于文学、艺术和科学领域也是没有意义的。

“第九套广播体操案”［北京市西城区人民法院（2012）西民初字第14070号民事判决书］之所以成为以智力成果并不位于文学、艺术和科学领域而否定该成果是作品的经典案例，是因为第九套广播体操富有独创性的动作设计直接源于人的智力投入，是那些设计广播体操的专家们基于自由意志直接决定了构成第九套广播体操的每一个动作。在这种情况下，讨论该成果所处的领域才有意义。换言之，人实施了基于自由意志决定表达性要素的行为是讨论其他一切作品著作权问题的前提。

中法评：下面我们将围绕“AI技术开发者在AIGC中的贡献认定与保护”这一主题展开研讨。有关该主题的问题主要有：其一，如何认定AI技术在AIGC中的贡献；其二，如何理解AI技术与作品认定要件中“独创性”的关系；其三，著作权法支持AI开发者对AIGC内容的版权或类似保护的主张，会对生成式人工智能产业发展产生何种影响？

王迁：第一个问题和第二个问题实质上是在讨论著作权法是否应当支持生成式AI开发者对AIGC的著作权主张，对此，我持反对态度，即不应当支持开发者对AIGC的著作权主张。

详言之，生成式人工智能的开发者当然贡献了智力成果，该智力成果就是作为计算机程序的代码化指令序列，以及程序背后的算法等。因此，开发者既可以对计算机程序主张著作权，也可以在符合法定条件的情况下申请相关技术方案的发明专利。然而，开发者的上述贡献不可能决定生成式人工智能所生成的内容。例如，每时每刻全世界不知有多少用户在使用ChatGPT、Midjourney和Stable Diffusion等生成式人工智能，其研发者无法仅仅通过对算法的设计和对人工智能的训练，就决定这些生成式人工智能如何回应千百万用户提出的问题或者输入的提示词。换言之，生成式人工智能根据用户的问题或提示词生成何种内容，是研发者所无法预料的。这也是此类人工智能被称为“生成式人工智能”的原因。

由此可见，研发者创作的结果是形成了计算机程序，而不是生成式人工智能根据每一次用户的提问或提示词生成的具体内容，因此，这些内容并不是研发者所创作的作品，研发者当然不能对其主张著作权。

针对第三个问题，我的回答是，著作权法不承认生成式人工智能研发者可以主张人工智能生成内容的著作权，不会对人工智能产业的投资和研发产生不利影响。例如，根据美国《版权法》的规定，对以美国为起源国的作品（即“美国作品”），如果没有在美国版权局登记，则日后发生纠纷时，无法提起版权侵权诉讼，也就意味着无法在美国获得版权保护。

众所周知，美国版权局对人工智能生成的内容不予登记，这意味着人工智能生成的内容在美国无法受到版权法的保护，研发者自然也无法在美国主张对该内容的版权保护。然而，代表了人工智能技术巨大进步的ChatGPT、Midjourney和SORA都是由美国公司投入巨大人力、物力和财力研发的。这恰恰说明美国不保护人工智能生成的内容并没有损害研发者的经济利益，打击投资者信心或挫伤人工智能研发、投资的积极性，并没有阻碍人工智能行业的发展。

对于“动手去绘制”是否为认定美术作品的门槛的问题，回答是肯定的。只是这个“动手”不限于直接持铅笔、水彩笔或毛笔等传统意义上的“笔”在纸上作画，也包括用鼠标通过Photoshop等绘图软件在屏幕上作画，或者手持电容笔在与电脑连接的平板上作画。但无论如何，仅仅通过文字去描述，是不能形成美术作品的。

对此，邓思渊的一篇文章《“这图一眼就是AI！”那你能展开讲讲么？》作出了极好的解释。文章指出：“视觉艺术，从本质上是不可言说的”；人类在画一幅画的时候“首先是想象出某个视觉形象，然后一步步细化，构成画面，这中间可以完全没有任何语言的参与”；而人工智能绘图则要求用户“首先去总结出画面中的元素，形成文字，然后再通过文字反向去描述出画面”，“要用语言去描述视觉，那么它注定只能传达出我们对于整个视觉世界中能够用语言描述的那一小部分”。

与此同时，对构成美术作品的“表达”应当有正确的理解。虽然《著作权法实施条例》在定义美术作品时，在“线条、色彩”之后还有“或者其他方式”的用语，但中心语是“造型艺术作品”。换言之，美术作品是艺术造型。脱离了艺术造型，就谈不上美术作品。没有艺术造型的相似，仅有对不同造型的构图的布局（简称“构图布局”）上的相似，不可能侵犯美术作品著作权。

在“西尔万与叶某青著作权侵权案”中，法院认定叶某青部分绘画构成侵权作品的理由，并不仅仅是“构图布局”相似。例如，叶某青的《冬日记忆》（图1）被认定为与西尔万的《马修和黑鸟》实质性相似，属于侵权作品。然而，二者相似之处远超“构图布局”，而是在许多相同的位置使用了轮廓、线条画法基本一致的大量细节，以此形成了艺术造型从局部到整体的相似性。

与之形成对比的是，在该案中，叶某青的另一些被诉侵权画作与西尔万的画作不但在整体艺术造型上有较大差距，而且在某一个能够相对独立存在的局部造型上也不存在实质性相似（如图2中的两幅画，方框中的为西尔万主张实质性相似之处），此时应当认为二者的相似之处在于构图布局和风格，这种相似就不能作为认定侵权的基础。

西尔万图叶某青图

图1 “西尔万与叶某青著作权侵权案”中构成侵权作品的部分绘画

西尔万图叶某青图

图2 “西尔万与叶某青著作权侵权案”中不构成侵权作品的部分绘画

同样道理，用户即使能够通过提示词大致划定图片的布局，也无法决定其中的造型，也就是不可能直接产生构成表达的艺术造型。在这种情况下，如前文所述，只能认为用户的贡献（即使为智力贡献）相对于人工智能生成的图片仅是思想。至于“AI文生图大模型生成图片的线条与色彩也可以由用户的提示词直接决定”的观点，读者自行向不同的人工智能输入相同的提示词，就能验证其是否成立，已无须再作任何辩论。

中法评：如果AI开发者不能获得对人工智能生成内容的著作权保护，那么，其能从生成式人工智能的研发中获得经济回报吗？法律又应当如何保护AI开发者的合法权益？

王迁：生成式人工智能的研发者在缺乏对生成内容著作权保护的情况下，能够从生成式人工智能的研发中获得经济回报。利用人工智能生成内容获得经济利益的模式，与利用电影等同样需要巨大投资的作品获得经济利益的模式存在极大区别，它并不是通过对人工智能生成内容本身的复制、发行和各种传播行为的规制实现的。

以ChatGPT为例，其盈利模式多种多样，一是区分免费用户和付费用户，免费用户在问题量较大时必须忍受较长的等待时间，而付费用户就可以实时获得ChatGPT的回答，从而使研发者能够从付费用户支付的费用中获得回报。

二是微软公司会将ChatGPT嵌入自身产品，包括Office和Bing搜索引擎，从而提升这些产品的用户体验，吸引更多的用户使用。由于Office本身就是收费软件，用户量的增加当然会给微软公司带来更大的利润。Bing搜索引擎虽为免费产品，但更多的用户当然会促使更多的商业机构使用其竞价排名服务或投放广告，也会提升微软公司的收入。

三是微软公司还将广泛许可其他商业机构在自身的服务和产品中接入ChatGPT，甚至包括在机器人中应用ChatGPT，以向其用户提供智能服务，从而产生相当可观的商业利润。由此可见，人工智能的研发者利用人工智能的盈利模式，主要是将其作为一种商业服务向个人用户及商业用户提供。可见，实现技术营利性的方式多种多样，许多情况下许可利用技术本身就足以营利。鉴于实现人工智能技术营利的商业模式，不将人工智能生成的内容认定为作品并提供著作权保护，并不会影响对人工智能技术的投资和研发。

中法评：接下来我们将围绕“用户在AIGC中的贡献认定与保护”这一主题展开研讨。有关该主题的问题主要有：第一，用户在使用生成式人工智能的过程中是否有可能作出独创性贡献？第二，如何认定用户对AIGC的智力贡献进而认定AIGC的作品属性？第三，著作权法保护或不保护AIGC，会对用户使用AI的行为产生什么影响？第四，在创作过程中，用户与生成式人工智能的互动过程，与传统的雇主—雇员、委托人—受托人、教师—学生之间的互动相比，有可比性吗？第五，著作权法保护或不保护AIGC，会对AIGC内容生态产生什么影响？第六，法律应当采取何种方案来保护用户贡献？

王迁：对于第一个和第二个问题，正如在讨论独创性标准时所述，脱离了思想—表达两分法去讨论独创性和“用户贡献”是没有意义的。用户的贡献当然可以在某种意义上是“独创”的，比如用户可以提出其他用户都想不到的提示词或者提示词的组合。然而，这里讨论的不是提示词或提示词的组合的独创性问题，而是用户作出的贡献是否等于创作出了作品。换言之，生成式人工智能所生成的在形式上与人类作品相接近的内容，是否由用户通过输入提示词所创作，或者说用户输入的提示词相对于生成式人工智能所产生的内容而言是不是思想，这才是问题的关键。

至于“如何利用AI大模型生成符合自己需求的内容也是需要花费时间和精力去学习的”并不是认定用户是作者的理由。否则，对于研究生导师而言，“如何指导研究生，以形成自己期待的优秀学位论文也是需要花费时间和精力去学习的”，难道研究生在导师指导下撰写的学术论文就成了导师的作品？

如在讨论独创性标准时所述，“生成式人工智能”的名称就恰如其分地揭示了此类人工智能工作的独特之处，那就是用户的任何提示词都只能影响所生成内容的主题（比如少女像）、风格（中国风）与基本材料（穿唐装或汉服等），而不能决定构成作品的表达性要素。因为这些表达性要素是由人工智能在用户输入的提示词勾勒出的大致范围内，根据其自身的算法和所受的数据训练自主生成的。换言之，生成式人工智能自身的特性就决定了它不像纸、笔和照相机那样是创作者的消极工具，而是具有高度的自主性。其生成的内容，并不是用户凭借其“独创”的提示词能够决定的。

在“AI文生图”著作权案判决书公布后，有使用者在三台配置不同的电脑上，按照判决书记载的该案原告生成四张图片的过程，运行同一版本的Stable Diffusion人工智能绘图程序，调入同一亚洲少女像模型包，输入相同的正向提示词、反向提示词和各种参数，然而在三台电脑上，每一台电脑生成的四张图片与其他电脑上生成的四张图片相互之间都有极大的差异(图3调整至此)。可以想象，如果在更多不同配置的电脑上继续进行测试，还会产生相互之间差异极大的新图片。

如果认为用户的输入就是著作权法意义上的创作行为，试问：用户的同一创作行为（运行同一人工智能绘图程序，调入同一模型包，输入相同的正向提示词、反向提示词和各种参数）怎么会产生在构图上差距极大的图片？合理的解释只有一个，那就是用户的输入相对于生成式人工智能自主产生的内容只是思想，用户并没有通过输入提示词和参数设定而创作人工智能生成的内容。

王迁：崔国斌教授认为，此前笔者所提及的实验“只是说明用户在‘单回合’暗箱模式下没有作出独创性贡献”，回避了“在AI系统许可用户以受控方式对选定图片进行线性修改的情况下，用户是否可以作出独创性贡献”的“真正的问题”。其实不然，笔者所主张且通过实验证明的，不仅是在“单回合”模式下，用户无法通过提示词决定人工智能生成的内容，“多回合”模式也是如此。

的确，“对比著名的‘太空歌剧院案’中AI系统最初输出画面与用户最终完成的图片之间的无数细节差异”，我们就能理解经过多次提示词输入之后，“用户利用AI修改画面的技术可能性”。

然而我们还是要问，该案中“无数细节差异”是用户发出的提示词所直接决定的，还是人工智能根据提示词，以自己的算法和所受的数据训练产生的？读者们仍然可以自行动手进行测试：向不同的人工智能输入同一幅图片（注意此时不同的人工智能所处理的图片是相同的），然后连续发出相同的文字提示要求修改，包括“利用文本指令限定局部特征的替换和选择”，经过三次、五次、十次乃至上百次通过发出相同提示词的“修改”之后，观察不同的人工智能根据同一张图片而生成的新图片是否相同。

面对如此不同的新图片，读者同样可以思考上文提出的问题：如果用户针对同一幅图片多次提出修改图片的提示词这一行为属于著作权法意义上的“创作”，为什么同一个“创作”行为能产生如此多不同的“作品”？特别需要指出的是，前文提及的在三台配置不同的电脑上，用同一人工智能生成不同的三套图片（每套含四张图片）的过程正是“多回合”生成。在“单回合”生成第一张图片后，用户面对图片不断修改提示词和参数，又形成了第二、第三和第四张图片。试问哪一次用户对提示词和参数的修改能够决定这一轮人工智能生成的图片？

此外，对于“多回合”生成模式的问题，由于笔者即将发表的文章将对此进行详细讨论，为避免与本文的雷同，此处不再赘述。当然，人工智能技术并不是一成不变的，它还会不断向前发展。然而，生成式人工智能发展的方向，是其越来越“智能”，也就是其自主性越来越强。这就意味着用户的输入越来越不可能直接决定生成式人工智能所产生的内容。

最近，由微软公司投资的OpenAI公司推出的“文生视频”人工智能SORA已经揭示了这一点。文字描述与视频之间的差异，比文字描述与图形之间的差异还要大。人工智能越来越不可能沦为像纸、笔和照相机那样人类创作的消极工具。前文引用的邓思渊的文章《“这图一眼就是AI！”那你能展开讲讲么？》，已经非常清楚地说明了“动口不动手”是不可能创作出美术作品的。这一原理无论是对从无到有生成图片，还是以已有美术作品为基础进行修改，都是成立的。

至于人能不能以人工智能已经生成的内容为基础，动手进行传统意义上的创作，并由此产生源自于本人的表达，从而对其修改后的内容主张著作权，这是一个“1+1=2”的简单问题，属于著作权法上的常识，和这次讨论的内容可谓没有任何关系。因为对此问题的回答当然是肯定的，这与被修改的内容是另一个人所创作的还是人工智能自主生成的，并没有什么关系。因此，对于用户可以通过自己动手修改人工智能生成的图片而形成作品，以及用户可以对人工智能生成的大量图片进行独创性的选择或者编排而形成汇编作品（但注意数量需达到一定门槛）的观点，笔者完全赞同。

只是这与“用户在使用生成式人工智能的过程中是否有可能作出独创性贡献？”等问题没有关系，因为这是在生成式人工智能生成了内容之后，再由用户对这些内容实施的行为。与此同时，以人工智能生成的内容为基础进行修改，或者对人工智能生成的大量内容进行选择或编排，也不是人工智能带来的新现象。

在人工智能技术出现之前，人们当然也能动手对《岩间圣母》进行修改（比如将该宗教题材的名画改成一幅讽刺画），也能对一万幅公有领域的油画进行独创性的选择、编排，从而编成《百幅名画精选》。这其中的著作权法问题，与被修改和汇编的每一幅画是否由人工智能生成又有什么关系呢？

问题的关键在于，人以传统的创作手法修改已有内容时，是以自己的自由意志直接决定了修改后的内容，只要由此形成的新内容与原有内容的区别达到了独创性的要求，就可以认定该修改行为是著作权法意义上的创作行为，此人当然可以主张类似于演绎作品的著作权。

对于第三个问题，我的回答是没有任何影响。显而易见的事实是，承认用户对人工智能生成的内容享有作品的著作权，和用户是否有动力使用人工智能并无关系，否则如何解释在美国不承认人工智能生成的内容是作品（既不是开发者的作品，又不是用户的作品）的情况下，有那么多美国用户愿意为ChatGPT付费？只要生成式人工智能的功能强大，就会有许多用户愿意使用，以获得自己所需要的内容。即使在我国，在“AI文生图”著作权案判决生效之前，用户使用各类生成式人工智能的热情同样高涨。

似乎没有证据显示，缺乏对人工智能生成内容的著作权保护，不通过著作权法“鼓励用户利用AI生成内容”，用户就停止使用或减少使用生成式人工智能了。况且，这场诉讼也不能证明普通用户渴望自己用生成式人工智能生成的内容受到著作权法的保护，或者一旦败诉就决定不再使用生成式人工智能。

对于第四个问题，在回答之前需要强调的是，当我们谈论用户与生成式人工智能的关系能否与雇主—雇员、委托人—受托人（其实质是发包人—承揽人，下同）以及教师-学生之间的关系类比时，我们是从用户的行为是否构成创作，或者说用户的输入相对于最终产生的内容而言是否为思想这个角度进行讨论的。用户与生成式人工智能的关系，与雇主—雇员、委托人—受托人以及教师—学生之间的关系高度类似的是，用户所进行的输入，与雇主向雇员、委托人向受托人以及美术学院的教师向学生发出的创作指示，都不可能直接决定最后形成的内容，而只能影响其主题风格和其中的素材等，只能构成思想。

因此，在上述四种关系中，无论是用户，还是雇主、委托人和美术学院的教师都不是真正意义上的作者。无论接受提示词或指令的是人还是人工智能（即接受者是否具有法律上的主体地位），都不会改变这一点。因为，此处讨论的是发出提示词或指令的行为在著作权法上的定性，这一定性只能根据行为本身的特征来确定。

有国家（如美国）将雇主视为雇佣作品的作者，这是典型的法律拟制，是解决作品版权利益分配的问题，而不是承认雇主实施了创作行为或者雇主是真正的作者，这一点在著作权法的理论中是清清楚楚的。这也就是为什么在“《通向天堂之近路》登记案中”，无论是美国版权局，还是美国联邦法院，都拒绝以美国版权法中“视雇主为雇佣作品作者”的条款为依据，将人工智能生成的内容登记在兼具开发者和用户身份的美国计算机科学家泰勒的名下。委托人可以基于合同取得受托人所创作作品的著作权，但没有哪个国家会承认委托人是著作权法意义上真正的作者。

用户向人工智能输入提示词，由人工智能根据自身的算法和所受的素材训练生成内容，并不是由用户的自由意志决定构成该内容的表达性要素，这与“人与人合作创作的场景”（要求每个人都参与了创作，也就是每个人都通过自己的自由意志决定了构成整体作品的一部分表达）没有可比性。能够作比较的是，美术学院的老师要求全班学生完成绘画。无论发出的指示多么具体、翔实和富有创意，一个班的学生所完成的绘画也不可能相同。这正是因为自然语言不可能精确地被转换为与之相对应的图形，每名学生都可以凭借自己的理解，发挥艺术想象力，在遵循要求的前提之下进行个性化的创作。因此，美术学院的老师也不可能仅凭提出创作要求，就被认定为全班学生所作绘画的作者。

如果认为“保护用户的贡献，可以激励用户使用AI技术生成内容”，因为“如何利用AI大模型生成符合自己需求的内容也是需要花费时间和精力去学习的，如果保护用户的贡献，那么就会有更多的用户去尝试使用AI技术”，那么，是否也应当认为上例中美术学院全班同学根据美术老师具体、细致和富有创意的绘画要求而绘制的每一幅画都是美术老师的作品？因为“保护美术老师的贡献，可以激励美术老师借学生之‘手’画出内容”，“如何让学生画出符合自己需求的内容也是需要花费时间和精力去学习的，如果保护美术老师的贡献，那么就会有更多的美术老师去尝试向学生发出要求”。显然，这样的结论和理由是不能成立的。

中法评：接下来我们将围绕对AIGC未来可能的法律制度设计展开讨论。支持著作权法将AIGC的相关权益赋予用户的学者，可以从对配套性安排之制度设计的角度展开讨论。比如，权利内容，权利归属，权利限制，侵权认定等等。反对著作权法将AIGC的相关权益赋予用户的学者，可以就未来法律制度中应对AIGC所须作出的调整展开讨论。

王迁：至少在目前，没有看出用著作权法保护生成式人工智能生成内容的必要性。非物质成果的本质是信息，而信息一旦公开就会自由流动，这是信息的本质属性。知识产权法为了鼓励、刺激更多的人投身于作品创作的活动，而将特定的信息即符合法定要求的作品从公有领域中提取出来，赋予专有权利加以保护，这属于特例，必须有充分的公共政策上的理由。利用生成式人工智能获得相应内容的成本是如此之低，并不需要法律赋予专有权利进行鼓励和刺激。否则，反而会引起“跑马圈地”，对大量生成式人工智能生成的内容予以保护，从而引起公地悲剧。

总之，智力投入的方式和形式也许是无穷无尽的，但著作权法保护的智力成果是有限的。笔者想再次强调一点，否认人工智能生成的内容是作品，与认定独创性是“有无”还是“程度”的问题，以及独创性需要达到何种程度的问题毫无关系。讨论独创性的前提，是用户通过输入关键词决定了人工智能生成的内容。脱离了这个前提去讨论独创性或者一切与著作权保护有关的其他问题，无论使用何种术语，如“智力贡献”“智力投入”“个性化选择与判断”“与众不同”等都是没有意义的。

一个显而易见但也经常被忽略的事实是：并非普天之下能反映智力投入的东西都能受到著作权法的保护。美国作为人工智能产业最为发达的国家，迄今为止也没有对生成式人工智能生成的内容提供版权保护。然而，如前所述，这既没有阻碍对人工智能产业的投资和人工智能技术的研发，也没有熄灭用户利用人工智能的热情。在这种情况下，又有什么必要去创造一种专有权利，为人工智能生成的内容提供保护呢？

微信号｜civillaw_ecupl

编辑｜王扶醉