社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

国浩视点 | 对比提问各大AI模型:如何看待DEEPSEEK被控侵犯ChatGPT的知识产权?

国浩律师事务所 • 1 月前 • 147 次点击  

事实回顾

2024年12月26日,DeepSeek发布了其最新的AI模型DeepSeek V3,该模型在训练成本上具有显著优势。2025年1月20日:发布新一代推理模型 DeepSeek-R1,性能与 OpenAI 的 o1 正式版基本持平,并开源模型权重。1月29日,OpenAI通过《金融时报》等媒体指控DeepSeek在训练其开源竞争模型时,未经授权使用了OpenAI的专有模型。

关于此热点事件,目前尚未形成最终结论。为了了解各大AI大模型对此热点问题的看法,也为了对比分析各大模型的计算逻辑与差异,我们特展开实证研究,向“DeepSeek"、“ChatGPT”、“KIMI”、“豆包”等多个AI大模型就“如何看待DEEPSEEK被控侵犯ChatGPT的知识产权?”问题进行询问,收到回复具体内容如下:


01

DEEPSEEK

关于DeepSeek被指控侵犯ChatGPT知识产权的争议,目前公开信息有限,但可以从技术、法律和行业实践角度进行理性分析:

(一) 技术层面的可能性

模型架构的通用性 :当前主流大模型(如GPT、LLaMA等)均基于Transformer架构,这一技术自2017年由Google开源后已成为行业标准。若DeepSeek基于公开技术进行独立研发,则属于合法创新。

训练数据的争议:若指控涉及使用ChatGPT的非公开训练数据(如专有语料库或输出内容),则可能构成侵权。但若数据来源为开源数据集或合法授权内容,则不涉及违规。

代码复制的界定:若DeepSeek直接复制了ChatGPT的专有代码(如模型实现、训练框架等),则可能违反著作权。但若代码为自主编写,即使功能相似亦受法律保护。

(二) 法律维度的考量

专利与著作权差异:模型架构若申请专利(如OpenAI的某些训练方法专利),则受专利法保护;而代码和特定数据集受著作权保护。需明确指控的具体标的。

地域法律差异:中国《生成式AI管理办法》要求训练数据合法来源,但未明确禁止技术路径的借鉴。美国则更强调专利和输出内容版权(如COURT案例对AI生成内容版权的态度)。

举证责任:指控方需提供代码相似性分析、数据泄露证据等实质性证据,而非仅凭功能相似性推断。

(三) 行业实践与竞争逻辑

技术趋同的必然性:大模型的核心能力(如上下文理解、多轮对话)必然导致交互体验相似,正如智能手机均具备触屏和App生态。此属市场竞争常态。

开源社区的边界:若DeepSeek基于LLaMA等开源模型微调,需遵守其商用协议(如Meta的LLaMA商用需单独授权),但此与ChatGPT无直接关联。

中国企业的合规策略:头部中国AI公司(如DeepSeek、智谱)普遍强调数据清洗、合规授权和架构创新,以避免法律风险。

(四) 理性看待争议

未审先判的风险:在缺乏司法判决或技术审计报告前,应避免对涉事企业定性。历史上类似争议(如Waymo vs Uber)多数以和解或部分侵权认定收场。

技术自主性的挑战:中国AI发展需在Transformer等通用架构上实现突破(如深度求索的MoE架构),而非依赖特定企业的技术黑箱。

行业影响评估:若指控成立,可能影响投资者对中国AI合规性的信心;若澄清为误判,则反映全球AI竞争中的舆论博弈。

(五) 建议观察方向

关注涉事双方是否进入法律程序,以及披露的技术证据(如代码相似度报告、数据溯源分析)。

分析DeepSeek的技术白皮书与开源项目(若有),判断其创新性成分。

注意政策动态,如中国监管部门对AI训练数据合规性审查的强化趋势。

总结:在现阶段,更可能的情况是技术路径相似引发的商业竞争摩擦,而非实质性知识产权侵权。AI行业需建立更清晰的数据合规标准与技术借鉴边界,以平衡创新保护与产业健康发展。


02

ChatGPT

近期,OpenAI指控中国初创公司DeepSeek在开发其AI模型时侵犯了ChatGPT的知识产权。据报道,OpenAI声称DeepSeek使用了一种名为“蒸馏”的技术,即利用大型模型(如OpenAI的模型)的输出数据来训练较小的模型,从而以较低成本实现高性能。  

微软也参与了调查,发现与DeepSeek相关的账户可能未经授权从OpenAI的API中提取了大量数据,这可能违反了OpenAI的服务条款。 

然而,值得注意的是,OpenAI自身也曾因在训练其模型时使用受版权保护的材料而面临版权侵犯的指控。因此,当前的情况引发了关于知识产权保护和AI模型训练方法的广泛讨论。

目前,相关调查仍在进行中,尚未有最终结论。此事件突显了在AI技术快速发展背景下,明确和保护知识产权的重要性,以及在创新与合法使用之间取得平衡的必要性。


03

KIMI

关于DeepSeek被控侵犯ChatGPT知识产权一事,可以从以下几个方面进行分析:

(一) 技术层面

数据蒸馏争议:OpenAI指控DeepSeek通过“数据蒸馏”技术,利用ChatGPT的模型输出来训练自己的开源模型。数据蒸馏是一种常见的技术手段,但如果未经授权使用他人的专有模型输出进行训练,确实可能构成侵权。

技术独立性:DeepSeek否认抄袭OpenAI的技术,强调自身模型是基于大量独立研发和调优得出的。大语言模型的开发需要大量算力、数据和专业知识,仅靠复制粘贴难以实现,因此DeepSeek的技术独立性有一定合理性。

(二) 法律层面

知识产权界定:知识产权保护的是创新成果,包括代码、算法、训练数据等。如果DeepSeek未经授权使用了ChatGPT的专有技术或数据,可能构成侵权;但如果其使用的是开源社区的公共资源,则属于合理利用。

证据与举证责任:目前OpenAI声称有证据表明DeepSeek侵权,但尚未公开详细证据。在法律程序中,OpenAI需要提供确凿证据证明DeepSeek的具体侵权行为,包括未经授权使用其技术、数据或模型输出等。

商标纠纷:DeepSeek在美国面临商标被抢注的问题,这与知识产权侵权是两个不同的法律问题。商标抢注涉及品牌标识的使用和注册,而知识产权侵权主要涉及技术、数据等方面的保护。

(三) 商业竞争层面

市场竞争因素:DeepSeek作为中国的人工智能企业,其产品性价比高,对OpenAI和微软等企业构成了一定的市场竞争压力。这种竞争可能引发行业内的敏感反应,甚至不排除商业竞争因素对知识产权指控的影响。

地缘政治因素:部分观点认为,此类指控背后可能受到地缘政治因素的影响。在全球科技竞争的背景下,人工智能领域的技术竞争尤为激烈,一些外部因素可能会被放大。

(四) 行业影响层面

对行业规范的影响:这一事件引发了对人工智能行业数据使用规范的深刻反思。如何在利用开源资源和保护知识产权之间找到平衡,是整个行业需要思考的问题。

对企业发展的影响:对于DeepSeek而言,这一指控对其品牌形象和市场信任度可能造成一定冲击。如果被认定侵权,可能面临法律制裁和市场调整;而对于OpenAI,这一事件也可能引发其对自身知识产权保护策略的进一步完善。

总体来看,DeepSeek被控侵犯ChatGPT知识产权一事是一个复杂的法律和技术问题,需要在具体证据和法律框架下进行判断。同时,这一事件也反映了人工智能领域知识产权保护的重要性和复杂性,对行业发展具有一定的警示作用。


04

豆 包

DeepSeek 被指控侵犯 ChatGPT 知识产权这一事件,需要从技术、商业、法律和国际竞争等多方面客观理性地看待:

(一) 技术层面

蒸馏技术的通用性:蒸馏技术是 AI 领域广泛应用的模型优化方法,学术界和工业界常使用经过人类对齐的 LLM(如 ChatGPT)输出来训练新模型,这是对公共知识资源的合理利用,若将其定义为侵权,那么全球大量 AI 研究都可能受到质疑。

技术创新的存在:DeepSeek 在模型架构上有创新,如 V3 模型的键值缓存管理技术、优化混合专家(MoE)方法,R1 模型的强化学习微调(RLHF)是 “从零开始学习推理能力”,机器学习专家也指出其数据集构建与训练方法完全独立,并非直接复制。

基础架构的公开性:大模型的基础架构如 Transformer 是行业公开技术,不能因为都使用类似基础架构就认定为抄袭,DeepSeek 与 OpenAI 的 GPT-4 在模型定位和优化方法上有明显不同。

(二) 商业层面

市场竞争因素:DeepSeek 的产品推出后取得了显著成绩,如 DeepSeek - R1 推理模型性能出色,成本却仅为 OpenAI 最新模型的三十分之一,还在苹果应用商店下载量跃居第一4。OpenAI 的指控可能有商业竞争的因素,通过指责对手来维护自身市场地位和商业利益。

行业发展影响:如果轻易认定 DeepSeek 侵权,可能会对 AI 行业的创新发展产生阻碍。因为很多初创企业和研究机构都是在现有技术基础上进行创新和改进,如果过度限制这种行为,可能会打击行业的创新积极性。

(三) 法律层面

证据的有效性:OpenAI 虽声称有证据,但至今未公布实质性证据,这种 “先定罪后举证” 的做法不符合正常的法律程序,难以让人信服指控的合理性。

条款的模糊性:OpenAI 的服务条款禁止用户 “使用输出来开发竞争模型”,但 “竞争模型” 的界定模糊,若以模型性能接近为标准,几乎所有 LLM 开发者都可能被卷入争议,这使得其条款在实际应用中缺乏明确的法律依据。

(四) 国际竞争层面

技术霸权思维:美国 OpenAI 与微软等对 DeepSeek 的指控,背后可能存在技术霸权思维,试图通过这种方式打压中国 AI 企业的发展,维护美国在 AI 领域的领先地位。

地缘政治因素:当前国际政治环境下,中美在科技领域的竞争日益激烈,DeepSeek 的崛起被视为对美国 AI 产业的威胁,所以其可能成为地缘政治博弈的对象,相关指控可能是出于地缘政治的考量,而非单纯的知识产权问题。


总 结

根据以上分析,我们总结得到:DeepSeek被指控侵犯ChatGPT知识产权的事件,从技术、法律、商业和国际竞争等多个层面引发了广泛争议。技术层面聚焦于数据蒸馏技术的使用和技术独立性,涉及模型架构的通用性、训练数据的合法性及代码自主性;法律层面则考虑专利与著作权差异、地域法律差异、证据的有效性和举证责任,以及服务条款的模糊性;商业层面,市场竞争压力和地缘政治因素可能影响了指控的背景和动机;行业影响层面,此事件引发了对人工智能行业数据使用规范的反思,以及对创新保护和产业健康发展的平衡思考。同时,根据对比分析不同AI模型的答案,我们可以发现,各大AI模型在分析此事件时关注的风险点各有差异,应综合考量。整体来看,该事件凸显了人工智能领域知识产权保护的复杂性和重要性,需要在具体证据和法律框架下进行客观判断,并寻求在技术创新、合法使用和国际竞争之间找到平衡。

作者简介

黄超

国浩知识产权业务委员会暨法律研究中心副主任、国浩上海合伙人

业务领域:知识产权、争议解决、房地产

邮箱:huangchao@grandall.com.cn

刘璐

国浩上海律师

业务领域:知识产权、房地产和争议解决等

邮箱:liulush@grandall.com.cn

詹悦

国浩上海律师

业务领域:知识产权、房地产和争议解决等

邮箱:zhanyue@grandall.com.cn

(国浩上海实习生鞠昕彤对本文亦有贡献。)

【 特别声明:本篇文章所阐述和说明的观点仅代表作者本人意见,仅供参考和交流,不代表本所或其律师出具的任何形式之法律意见或建议。】


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178730
 
147 次点击