三、以吉卜力风格为例从八识理论看AIGC视觉风格的本质
生成式人工智能(GenAI)技术通过算法对海量视觉素材进行学习、提取特征、重组生成,能够快速复刻特定创作者或流派的视觉风格,其中以吉卜力工作室的温暖治愈风格等最为典型。此类人工智能生成内容(AIGC,即应用GenAI生成的内容)引发的核心版权争议的是:AIGC复刻的“视觉风格”本身能否成为版权保护的客体? GenAI生成的风格化作品是否具备原创性,进而获得版权保护?现有版权法以“创意/表达两分法”为核心原则,但该原则难以回应AIGC视觉风格生成的特殊性——AIGC的“风格复刻”
并非人类创作者的主观心识表达,而是算法对客观视觉特征的模仿与重组,其本质与人类创作的风格存在根本差异。
唯识学以“万法唯识、境不离识”为核心命题,通过由眼识、耳识、鼻识、舌识、身识、意识、末那识、阿赖耶识构成的八识体系,系统解析人类的认识活动、精神表达与外在现象的关系。人类创作的视觉风格,本质上是八识协同作用的结果,是心识活动的外在显现;而 GenAI生成的视觉风格,仅能模仿人类风格的外在视觉特征,无法复刻心识层面的审美倾向与创作习气。从唯识学视角出发,可以穿透AIGC视觉风格的外在表象,把握其与人类创作风格的本质区别,进而清晰界定其版权保护边界,破解当前AIGC视觉风格版权保护的困境,推动版权理论与AIGC技术发展的适配。
本文基于唯识学的八识理论,搭建“八识—AIGC生成过程—版权边界”的分析框架,结合吉卜力风格的案例,填补唯识学与版权法学交叉研究的空白,为AIGC视觉风格的版权保护提供新的理论视角与解决路径。
(一)唯识学八识理论要义
唯识学认为,一切外在现象皆是心识的显现,八识相互协同、相互依存、动态演进,构成人类认识与精神活动的完整体系,其核心功能与作用层次如下:前五识(眼、耳、鼻、舌、身识)是认识的基础,核心功能是“了别境缘”,即接收外在客观世界的色、声、香、味、触等感官素材,为后续心识活动提供原始基础;第六识(意识)是认知中枢,具有“分别、判断、构造”的功能,能够对前五识获取的素材进行加工、整理、组合,形成具体的外在表达;第七识(末那识)的核心功能是“恒审思量、执我为有”,即执着于“自我”的存在,这一
“我执”在潜意识与表层意识的交互活动中,决定表达的主观气质,它会“染污”前六识,并与“我痴、我见、我慢、我爱”四种根本烦恼恒常相应,这些烦恼本身蕴含了价值和情感倾向,相当于将自身的审美偏好、价值判断、情感倾向投射到认识与表达活动中,决定表达的主观气质;第八识(阿赖耶识)是根本识,具有“藏识”功能,储存一切心识活动的“习气”(即种子,是长期形成的惯性、记忆、倾向等),是人类表达稳定性与独特性的深层根源。
在人类创作活动中,视觉风格的形成是八识协同作用的结果(即现行):前五识获取视觉素材,意识对素材进行构造形成具体表达,末那识赋予表达独特的审美气质,阿赖耶识的习气决定风格的稳定性与独特性。这种“心识—表达”的关联,是人类创作风格具有原创性的核心根源,也是版权保护的逻辑基础。
(二)AIGC视觉风格的生成机制
AIGC的视觉风格生成是通过数据学习+模型拟合+概率生成,让 AI学会模仿、重组与输出视觉样式。在数据驱动学习方面,模型用大量图像(绘画、摄影、动漫等)训练,通过数学方式来表征图像的纹理和相关性,得到颜色、笔触、构图、光影、线条等风格特征,使风格与内容产生关联。在特征提取与编码方面,用编码器把图像内容(画什么)和风格(怎么画)分别或联合编码成高维向量,分离内容特征与风格特征。在风格迁移与融合方面,通过注意力机制、归一化、卷积或Transformer结构,将内容特征与风格特征融合,把一种风格的视觉规则迁移到另一内容上。在概率生成与优化方面,生成模型按学习到的分布,逐像素/逐区域预测像素值,通过损失函数约束颜色、结构、纹理与目标风格一致,迭代优化输出结果。在条件生成控制方面,
输入文字、标签、参考图等条件,引导模型聚焦对应风格,生成符合要求的视觉内容。极简言之:先通过神经网络从海量图文数据中学习复杂的模式、结构和语义关联,采用更复杂的融合、调制或引导生成机制使风格规则与内容叠加,最终生成对应风格的视觉效果。
相较人类的创作活动,GenAI并无前五识的主动缘取与个性化经验摄入,仅被动接收和处理训练数据,虽然现代AI(如强化学习)存在主动探索机制,但其本质仍是算法驱动的数据处理,而非真正的感官体验;GenAI能否生起第六意识的原创性建构,学界存在明显分歧,有认为AIGC本质上是对既有数据的重组,也有认为AIGC存在原创性的内容;GenAI未形成第七末那识的审美执取与情感投射,其风格生成是通过学习数据中的统计特征来实现的,是对人类风格外在表征的数学建模与再现;GenAI没有第八阿赖耶识的习气种子与创作相续,其风格稳定性依赖模型结构、参数设定与训练数据,AIGC的风格稳定性主要依赖于模型结构、参数和训练数据,而非深层的精神内核与习气积累。然而,持续学习等技术正在探索如何让模型在学习新知识的同时保持旧知识(类似于创作相续)。
三、以吉卜力风格为例从八识理论看AIGC视觉风格的本质吉卜力风格作为全球知名的视觉风格,以温暖治愈的色彩、细腻的线条、充满幻想的场景、贴近自然的角色设计为核心特征,其本质是吉卜力团队创作者八识协同作用的结果。下面结合八识理论,逐识拆解AIGC吉卜力风格的本质与局限。
(一)前五识:素材摄取的被动性与局限性
人类创作者在形成吉卜力风格的过程中,前五识主动感知自然、生活中的色彩、光影、场景等素材,这些素材经过长期积累,成为风格形成的基础。吉卜力作品中的自然场景(如草原、森林、溪流),均源于创作者对现实自然的感知与提炼,具有个性化的素材选择特征。
GenAI生成吉卜力风格时,前五识对应的是算法对训练数据的被动读取。算法仅能从预设的吉卜力作品中提取线条、色彩、构图等素材,无法主动感知现实世界,也无法进行个性化的素材选择。AIGC的“素材摄取
”并非真正意义上的前五识作用——前五识的核心是“了别境缘”,即对客观世界的主动感知与识别,而AIGC的素材提取是算法的机械读取,缺乏心识的主动性与感知性。因此,AIGC所依赖的吉卜力风格的原始视觉素材(如基础色彩、线条形态、场景元素),本质上是人类创作者前五识感知成果的二次利用,AIGC仅被动读取,无原创性;素材本身为客观可共享内容,不符合版权保护的原创性要求,也无法成为版权保护的客体。
(二)意识:构造活动的模仿性与非原创性
人类创作者的意识,能够对前五识获取的素材进行原创性构造。吉卜力团队的创作者通过意识,将自然素材与自身的创作理念结合,设计出独特的角色形象、场景布局、色彩搭配,形成具有原创性的具体表达——如《龙猫》中的龙猫形象、《千与千寻》中的汤屋场景,均是意识原创性构造的结果,也是吉卜力风格的核心载体。
AIGC的“意识对应环节”是算法对视觉特征的模仿与重组。算法根据训练数据中提取的吉卜力风格特征,按照预设规则进行拼接、组合,生成看似符合吉卜力风格的画面,但这种构造活动缺乏原创性——它无法形成新的创意(idea),也无法选择个性化的表达(expression),仅能在训练数据的范围内进行机械模仿。从唯识学视角来看,AIGC的构造活动并非真正的意识作用:意识的核心是“分别与创造”,而AIGC的构造是算法的被动执行,缺乏心识的原创性与主观性,其生成的表达本质上是对人类具体表达的模仿,而非独立的原创性表达。如果GenAI生成的具体画面、角色设计等,超出对吉卜力作品的简单模仿,具有自身独立的选择与安排(如原创角色造型、独特构图),具备原创性,则在一定条件下可受版权保护(相关论述详见本文参考文献[2]);但单纯模仿的表达不受保护。
(三)末那识:审美倾向的缺失与复刻的表象性
吉卜力风格的核心气质——温暖、治愈、细腻、充满人文关怀,本质上是吉卜力团队创作者的末那识审美偏好与情感倾向的投射。创作者通过末那识,将自身对自然、生命、情感的理解,融入作品的视觉表达中,形成独特的风格气质。这种气质是主观的、个性化的,是人类心识活动的体现,也是吉卜力风格区别于其他视觉风格的核心特征。抽象气质与审美倾向处在主观心识层面,无法被具体界定、量化与固定。
GenAI生成的吉卜力风格作品,仅能复刻这种气质的外在表象。如使用温暖的色彩、细腻的线条,但无法真正理解这种气质背后的审美偏好与情感倾向,更无法进行自身的情感投射。从唯识学视角来看,末那识的核心是“执我与审美投射”,而AIGC不存在“自我”意识,也无法形成自身的审美偏好与情感倾向,其风格气质的复刻仅为算法对视觉特征的模拟,不具备真正的审美倾向,不符合版权“可复制、可识别”的保护要求,属于抽象的创意范畴,无法成为版权保护的客体。
(四)阿赖耶识:创作习气的缺失与风格的不稳定性
吉卜力风格的稳定性与独特性,源于吉卜力团队创作者阿赖耶识中储存的创作习气。创作者长期的创作实践、审美积累、生活体验,转化为阿赖耶识中的习气,潜移默化地影响意识的构造活动,形成稳定的表达模式。这种创作习气是独一无二的,是人类创作者精神积累的体现,也是吉卜力风格无法被轻易复刻的深层原因。
AIGC不具备阿赖耶识,也无法形成自身的创作习气——其风格的稳定性仅依赖于算法参数与训练数据,一旦调整参数或更换训练数据,生成的风格就会发生变化;即使长期生成某一风格的作品,也无法形成深层的创作习气,无法复刻人类风格的精神内核。从唯识学视角来看,阿赖耶识的创作习气是人类风格独特性的根本来源,属于内在心识活动,具有隐蔽性、不可证性,无法通过外在证据固定;而AIGC缺乏这一核心要素,其生成的视觉风格仅为外在特征的模仿,不具有真正的独特性与稳定性,不属于可版权保护的外在表达。
(一)意识层面的原创性具体表达是保护核心
将八识理论与AIGC视觉风格生成机制相对应,结合版权法的创意/表达两分法原则,可以明确AIGC视觉风格的保护边界:仅第六意识层面具有原创性的具体表达可有限保护,前五识的素材、末那识
的审美倾向、阿赖耶识的创作习气均不保护。
结合八识理论和版权法理,AIGC视觉风格的版权保护核心,应聚焦于第六识所对应的“具体表达”,而非风格本身。在司法实践中,应严格区分“风格模仿”与“具体表达复制”:(1)若AIGC仅模仿吉卜力风格的抽象气质、色彩倾向、线条特点,未复制具体的构图、角色设计、场景布局,且无自身原创性,则既不构成版权侵权,也不能获得版权保护;(2)若AIGC复制了吉卜力作品中具有原创性的具体表达(如独特的角色形象、专属的场景设计),则可能构成版权侵权;(3)若AIGC在模仿风格的基础上,进行了独立的原创性设计(如原创角色造型、独特构图),具备原创性,在一定条件下可获得版权保护。
(二)“具体表达的实质性相似”是侵权认定核心标准
唯识学视角下,AIGC视觉风格的侵权认定不应以“风格相似”为标准,而应以“具体表达的实质性相似”为核心。因为风格属于末那识审美倾向与阿赖耶识创作习气,是抽象、不可固定的,无法作为侵权认定的依据;而具体表达属于意识构造的成果,是可固定、可识别、可复制的,能够作为侵权认定的核心依据。在司法实践中,应重点审查AIGC与原作品之间在构图、角色设计、色彩搭配、笔触细节等方面是否存在具体表达的实质性相似,而非审查风格是否相似,避免将抽象风格纳入侵权认定范围,以平衡创作者与社会公众的利益。
(三)以心识原创性的认定权重区分AIGC与人类创作
人类创作的视觉风格是八识协同作用的结果,核心在于心识的原创性与主观性;而 GenAI生成的视觉风格是算法的模仿与重组,缺乏心识的原创性。在版权认定中,应强化心识原创性的认定权重:对于人类创作的风格化作品,只要其具体表达具有原创性,即可获得版权保护;对于 GenAI生成的风格化作品应严格审查其是否具备真正的原创性、而非单纯的模仿——只有当 GenAI生成的具体表达超出训练数据的范围,体现出独立的原创性选择,才能在一定条件下获得版权保护,避免将算法模仿的成果等同于人类创作的成果。
唯识学的八识理论为解析AIGC视觉风格的版权边界提供了独特的哲学视角: GenAI生成的视觉风格本质上是算法对人类风格的外在视觉特征的模仿与重组,仅能对应人类前五识的素材摄取与第六识的模仿性构造,缺乏末那识的审美倾向与阿赖耶识的创作习气,与人类创作的视觉风格存在本质区别。从版权保护边界来看,AIGC视觉风格的“抽象气质、审美倾向”不受版权保护,仅具有原创性的具体表达在一定条件下可获得有限的保护;吉卜力等原创作团队的风格本身,也无法被独占保护,因为其属于心识层面的审美与习气,不是可固定、可复制的法律客体。
注释(上下滑动阅览)
【1】寿步.人工智能术语agent的精准译解及其哲学意义[J].哲学分析, 2023, 14(3): 130-143.
【2】寿步.人工智能生成内容:可版权性和版权人问题[J].科技与法律(中英文), 2024(4): 60-72.
【3】寿步.基于唯识学的人工智能agent-agency-action框架[J].上海师范大学学报(哲学社会科学版), 2026(1): 77-93.
作者:寿步
编辑:Sharon
