法定许可费用既需要现实合理的具体标准,也需要得到卓有成效的收取和转交,如此才能保障著作权人的经济利益。许可费用标准的合理性和收转程序的可操作性也许是人工智能著作权的法定许可探讨中最为棘手的问题。“这一主张是有意义的,但付诸法律规定是不容易的”,正是其导致国内外的许多观点在整体积极之余又难免存在顾虑。循此,下文将针对法定许可费用的制定和收转规则构建进行讨论。
1.法定许可费用的制定
法定许可与产品市场之间自始存在一种互为矛盾的关系:一方面,降低社会交易成本的制度功能决定了“一刀切”式的许可费用形态,致使法定许可与市场的疏离;另一方面,为避免作者群体利益无法实现而导致社会失衡,许可费用又要尽量贴近市场标准。这种矛盾关系很容易让法定许可费用规则陷入顾此失彼的局面。法定许可作为著作权强制标准化交易的一种形式,其单方面定价机制很容易对权利主体造成利益损害。
为避免这一问题,我国应当更为科学、缜密地设计机器学习法定许可费用。囿于考量因素和专门理论的缺失,可以就这一问题参考侵权损害赔偿中许可使用费的裁定方法。也就是说,应当奉行以市场价值为中心的宏观政策和总体标准,虽然不需要将许可费用严格对标作品的实际市场价值,但是需密切关注著作权作品的普遍价值、学习作品数量、通货膨胀、国民消费水平、权利人预期收益、行业管理及国外定价等因素的变化情况,定期重新研判并调整费用标准。许可费用的计算还需要重点考虑作品类型,甚至可以延伸到背后的创作成本、独创性高度及市场知名度等因素。
机器对于作品的“部分学习”则涉及两个方面的思考。其一,部分作品是否仍然能够获得著作权保护?其二,如果机器使用的部分本身也足以构成作品,那么法定许可费用是否也要进行比例性的调整?这种比例思维在国内外立法和司法活动中多有体现。机器使用部分作品的行为引申出了“权利价值贡献”和“侵权价值贡献”的判定,其进一步引申出的问题是,机器学习法定许可是否需要对每个对象作品及其使用方式进行独立分析,再决定许可费用的有无抑或多寡?本文认为,虽然这一主张有助于法定许可费用的层次优化,但将消耗大量的立法成本和不同管理组织间的协调成本。从交易效率和企业操作的现实角度,动辄数以百万计的作品也使其难以付诸实践。未来在我国著作权集体管理制度趋于成熟并且与人工智能产业建立高效互动机制的情况下,可以考虑由负责不同作品的管理组织各自制定计费标准。在现阶段,针对不同类型作品和作品的部分使用,建议不再作价值或者比例上的区分。
2.法定许可费用的收转
在新技术浪潮导致市场暂时失灵的特殊时期,通常有两种著作权许可制度可供选择:集中许可制度和法定许可制度,自由协商更多被视为二者的补充。仅就许可费用的收取而言,两种制度不同程度地依赖于著作权集体管理组织的运行。著作权集体管理组织将在人工智能时代发挥重要作用,并且有观点认为,其在本职工作之外还具有筛除低质量作品和低意愿作者的功能。如此一来,著作权集体管理组织负责管理的作品平均质量将高于使用者自行搜索获取的作品,还可以大幅降低大语言模型所需要的数据体量和算法负荷。
尽管如此,机器学习市场并不适合采用集中许可模式。囿于严控组织设立、专属许可关系、一揽子许可模式等制度性问题,著作权集体管理的市场垄断隐患依然存在。垄断的后果之一是歧视性许可,对于作者而言,人工智能模型有可能根据接触作品和获取许可的情况,为降低成本而调整后续机器学习的作品选取标准和策略,导致一种新的“算法技术歧视”现象。
法定许可依然是迅速重建利益平衡的最佳方案,其费用收转仍需通过著作权集体管理组织来配合执行,但是,此类组织长久以来在实际运行效果方面的弊端必须得到纠正。在许可费用的收取环节,由作品使用者承担更多的注意义务,在成本整体可控的前提下,对所使用的作品进行必要的信息标注,明确模型研发者的信息披露注意义务。
费用转付环节则有更为繁复的操作性难题,尤其是集体管理组织对作者的搜寻定位和未分配费用的披露监管。报刊转载法定许可曾经因为无法觅得作者等原因,其费用收转比例较低,后来有所好转。我国虽然未曾引入美国版税法官和作者审计权等特色制度,但是现行《著作权法》第8条中的权利信息查询机制是一条值得继续探索的道路。针对机器学习著作权许可的特殊场景,建议专门建立“人工智能法定许可信息查询系统”,全面披露使用主体、作品明细、作者身份、费用收转执行情况等信息。
孤儿作品著作权的归属、行使和救济并非著作权制度中的主流问题,其立法完善的进程相对比较迟缓。早期的孤儿作品多为馆藏文物,如今信息网络技术的普及则是用另外一种方式造就了孤儿作品。网络空间中的作品传播和使用具有更加明显的信息不对称性和非市场性。对于前者,当作品在网络环境下经历了多次且广泛的复制传播,且没有显性水印等数字标识措施的配合时,作者信息很容易逐渐脱离于作品,使用者继而无法正常获得许可。后者更多是指作品由于市场价值较低而遭到了作者的遗忘和放弃,也就是作者在有能力对作品进行身份绑定的情况下选择不作为,而数字内容的高速流动性、消费性和瞬时性特征进一步放大了这一现象。事实上,现实世界中的大多数作品都是非专业创作者的“网络弃儿”,其变相流入了公有领域。同时也不难发现,我国现有的孤儿作品制度很难适用于网络环境。
尽管我们无从统计网络孤儿作品的绝对数量或者相对比例,但是鉴于机器学习行为的持续时间、实施次数和数据集合体量,机器学习作品中必然存在大量孤儿作品。2014年国务院法制办公室公布的《著作权法(修订草案送审稿)》第51条曾经借鉴了英国、日本等国的法定许可模式,规定使用者在尽到勤勉查找义务的前提下,有权对孤儿作品进行付费使用。囿于举证责任、费用支付、作者搜寻等工作所带来的高昂成本,这一模式在域外实践中已经暴露出制度性的缺陷。人工智能时代的孤儿作品若是单独适用法定许可很难具备操作性,可以考虑责任限制为主、法定许可为辅的二元模式。
源自美国法的责任限制模式允许人工智能产业在未获作者许可的情况下,直接使用孤儿作品。该模式对使用者的主观善意有所要求,这一要件一般指使用者应当尽到“查找作者”的注意义务。对此,采用责任限制模式的国家和地区在立法上设立了不同程度的义务标准,例如美国版权局主张的“善意与合理勤勉”标准、欧盟《孤儿作品指令》的“勤勉与强制询问”标准、加拿大和匈牙利法的“合理努力”标准、韩国法的“尽力”标准等。繁重的查找义务有可能制约责任限制模式的应用,但是如果查找义务的要求过低,人工智能研发者必然会在象征性地查找之后便径直免费使用他人作品。本文认为,孤儿作品原则上优先适用责任限制模式,但是这一特殊情形必须受到几个方面的约束。首先,使用者主观要件的善意标准可以摒弃明显严苛的“尽力”标准,但仍应当遵循更为公平且契合“合理注意义务”原则的“勤勉”标准。其次,明确“勤勉”标准的具体意涵。可以借鉴欧盟及其数字图书馆高级专家组制定的强制询问规则,要求人工智能研发者借助自动技术或者人工操作,穷尽地访问、搜寻指定孤儿作品数据库。最后,倘若作者后续出现并索取许可费,则从责任限制模式转为法定许可模式,依据统一的法定许可收费标准予以补偿。
我国在报刊转载法定许可和录音制品制作的法定许可规则中,赋予作者声明拒绝授权的权利,这一做法在逻辑上与法定许可防止垄断的功能存在一定矛盾,因此颇受争议。欧盟《数字化单一市场版权指令》第4条第3款规定,文本和数据挖掘的权利保护例外是建立在“权利人没有以适当方式明确保留对上述作品或其他内容的使用”之上,属于世界上主流著作权制度中少数的类似立法。我国学界的相关研究尚未涉及这一问题。本文认为,机器学习法定许可可以沿用著作权人的声明退出机制。
传统法定许可模式的探讨往往隐含了一种假设,即产业中的一部分著作权人时刻准备垄断市场,继而作出拒绝许可、提高许可费用等妨碍公平交易的行为。由此得出的结论是,声明退出机制容易遭到此类权利人的利用而导致法定许可的效果大打折扣,甚至有可能在中小型著作权人的盲目跟风之下成为一种普遍现象。“滥用声明保留机制”的观点或许有一定道理,但是在人工智能时代下,著作权人却是被迫站在了“失去权益”“难保生计”还是“妥协共存”的十字路口,难言怀有多少左右市场的野心。美国大量作者组织在奋起捍卫权利的过程中,面对同样强硬的合理使用主张,陆续表示如果能够通过许可机制获得尊重和经济收入,便乐于接受这一安排。同时,其寄希望于影视行业与人工智能企业约定,在未来的影视作品制作中保障人类作者的就业。事实上,自2020年人工智能著作权问题引发社会利益矛盾以来,美国历史最悠久、规模最大的作家专业组织——美国作家协会在其游说活动中发布的21份倡议声明,几乎全部包含了有关著作权许可制度构建的主张。著作权人的传统价值观念及其行为规律并不适用于人工智能的社会场景,即便有权利人选择声明退出,其自行协商和维权在现实中缺乏持续性,组织协会也很难提供足够的援助。
声明保留与主体的趋利性之间存在直接关系。主张声明保留的主体一般仅限于少数大型著作权主体和专业著作权经营机构。此类机构具备更强的趋利性、谈判能力、财政实力,能够与人工智能产业展开平等的、规模性的合作对话。相较之下,个体著作权人很少自主声明保留,对于仅仅为了博取一线生机的传统创作者群体而言更是如此。虽然实践中多有作品发表的媒介平台(例如首发报刊)对法定许可规则发布拒绝声明,但其法律效力值得商榷,否则将变相形成一种媒介平台主导的集中许可机制,挤占原属于法定许可的适用空间。由于适用场景有限,少量的作者退出情形不会削弱法定许可模式的社会普适性,甚至可以就许可费用的市场化定制,为著作权行政管理部门和集体管理组织提供有价值的参考。