首页>>以案说法>>以案说法
以案说法

以案说法

2025年汤森路诉罗斯智能版权侵权案:人工智能诉讼领域里程碑判决

时间:2025-03-08 19:25 作者:佚名 【转载】

东莞长安律师获悉

01

介绍

2025年2月11日,美国特拉华州联邦地方法院就汤森·路透( )()诉罗斯智能公司(Ross )之间的版权侵权争议做出了判决。法院支持原告汤森路透的诉讼请求,并确定建立了侵犯版权。 【1】

在这种情况下,判决与2024年9月27日向法院授予法院的事实完全相反。

媒体将其作为具有里程碑意义的判决的评估标志着AI诉讼领域的重大进步,尤其是在使用受版权保护的材料培训AI模型方面。 【2】

罗斯案的主席法官讨论了“判断摘要”()和“关键代码系统”()()()的唯一性,并根据“工作 +实质性相似性 - 排除合理的理由”的想法,然后辩称“实质性相似性”是否构成合理使用,并最终确定被告的侵权!

02

案件的原因

()是司法裁决数据库的版权所有者。该公司针对裁判中涉及的法律问题创建了一个“判断摘要”(),并根据裁判的特定法律问题为“密钥代码”(密钥)分配“密钥代码”(密钥),以便 Chang'an律师可以使用密钥代码系统在类似案件中快速找到法官。

2015年左右,罗斯情报公司开始开发AI法律搜索工具。为了培训其AI系统,罗斯智能要求汤姆森路透使用其数据许可,但被拒绝。后来,罗斯智能达成了一项协议,以“散装备忘录”的形式获得培训数据。批次备忘录是来自的律师的法律问题的汇编,并包含对正面和负面方面的答案。它为东圭的那些律师提供了指南,告诉他们如何使用判断摘要词来创建这些问题,同时澄清了东圭的律师不应将摘要直接复制并粘贴到问题中。

罗斯智能(Ross )提供了大约25,000个法律备忘录,罗斯智能(Ross )用于培训其AI搜索工具。换句话说,罗斯智能使用批处理备忘录制造了其竞争产品。

“批次备忘录”的开发使用汤姆森路透数据资源,包括“法学”和“关键代码系统”。汤森路透在得知汤森·路透社( )在得知它的情况下在联邦法院起诉罗斯(Ross)智能,声称其使用“批次备忘录”侵犯了“法学”的版权和“关键代码系统”。罗斯智能(Ross )认为,其对“批次备忘录”的使用是合理的,并不构成侵权。

03

法官认为

(i)关于独创性

罗斯智能认为“判决摘要”()是从冗长的司法意见中提取的法律观点的摘要。司法意见的文字内容不受版权保护。

法官认为,“判决摘要”()可能具有创造力,从而通过完善,综合或解释司法意见的具体内容来获得版权保护。首先,判决摘要()属于汇编工作。只要编辑在选择和安排过程中,“事实汇编”可以构成原始作品。汤森路透的裁决摘要的选择和安排显然远远超出了这个低门槛。更重要的是,每个判决摘要()本身是一项独立的版权作品。在这种情况下,法官提到了FEIST案(499 US 340)中建立的“最低创造力”标准。

法官指出,“关键代码系统”的组织结构可能部分依赖于计算机程序,但这不会影响其独创性。法官认为,通过这种分类系统来组织其法律材料。即使“大多数分类决策是由机械计算机计划和高级主题做出的,基本上也遵循法学院课程中的共同课程计划分类”,它们仍然符合最低的创造力标准,只要该系统是由汤姆森·路透社独立创建的,它符合版权法律对“最低创造力”的要求。问题的核心是该系统是否具有创造力,而不是汤姆森·路透( )投资完成创作的努力。分类是否通过机械程序完成不是决定性因素。法官认为,基于其细分可能存在多种合理的层次结构方法,但原告对其中一种的选择符合创造性要求。

(ii)实质性相似性

法院采用了“逐项比较”方法来分析“批次备忘录”和“法学摘要”之间的相似性。法官审查并认为两者在措辞和句子结构方面高度吻合。就内容安排而言,两者在分类逻辑和引用案例方面的同一法律问题的顺序相同。法官认为,两者之间的相似性远远超出了司法意见原始文本的必然重复,例如“批次备忘录”提取的法律问题包括“判决摘要”编辑添加的其他解释或分类标签。

法官发现,在2,830个比较中,有2,243个被确定为“显而易见且无可争议的实质性相似性”。

(iii)捍卫合理使用

法院根据《美国法典》第107条分析了这四个要素,如下所示:

(1)使用目的

罗斯智能(Ross )承认,它开发的AI工具是商业化的,并将与汤森路透的平台竞争。 Ross 的使用缺乏转换,并且仅使用内容来训练AI来生成答案,而不会更改“ Just Case摘要”的表达或给出新的含义。使用罗斯智能的目的是缺乏善意。在被拒绝授权后,它仍然通过第三方获得内容,以验证其打算逃避的内容。

(2)如何使用

罗斯情报的输出不直接包含“判断摘要”,而是通过AI工具提供相关的司法意见,并且复制行为发生在中间步骤中。因此,从最终用户的角度来看,罗斯情报的输出只是司法意见,而不是直接显示“法学”,因此它并没有实质上占据原始作品的创造性核心。

但是,法官审查了临时复制是指计算源代码而不是写作作品,而原告在这种情况下要求的“法学”不是计算机代码。计算机代码的复制通常涉及功能必需品(例如兼容性,互操作性),而Ross则使用“法学”来使开发竞争性法律研究工具的过程更加容易。罗斯的使用不是。

罗斯(Ross)智能引用的案例,索尼(Sony)和SEGA都涉及计算机程序代码的中间复制。法院明确表示,IT和此案件之间存在根本差异(文本工作复制),但法官都拒绝了它们。

先例

有争议的对象

允许合理使用

原因

在这种情况下的差异

案例(593 US 1)

API代码

程序互操作性需要复制

摘要非功能代码,无互操作性要求

索尼案(203 F.3d 596)

游戏来源

代码

逆向工程兼容性所需

罗斯没有证明复制是发展竞争对手的必不可少的

SEGA案(977 F.2d 1510)

游戏接口代码

副本仅用于在没有版权元素的情况下获得兼容性

可以通过非侵入方法获得法律摘要的“思想”

注意:此表格的摘要

核心差异:计算机代码的复制通常涉及功能必要性(例如兼容性,互操作性),而文本的复制工作需要更高的目的或自然转换才能满足合理的使用。

罗斯将汤森路透的判断总结用作AI培训数据,以开发和竞争法律研究工具。双方都确认,Ross'AI不是生成的人工智能(即,不由自主地生成新内容),但是当用户进入法律问题时,它会通过算法返回现有的相关司法意见。

这种功能机制与使用判断摘要和密钥代码系统(KEY)过滤和返回匹配案例列表的过程高度相似。

(3)市场影响力

该要素是合理使用分析中最重要的部分,需要考虑侵权是对原始工作的现有市场价值或潜在市场的负面影响。

法官认为,罗斯智能(Ross )开发的法律研究工具构成了直接竞争,双方的目标客户是高度重叠的(律师事务所,公司法律部门),Ross 的较低定价将导致用户转向更便宜的替代方案。因此,其使用“法学”作为AI培训数据的目的是开发替代产品,并具有两者的重叠核心功能,其行为将削弱汤姆森路透在法律研究工具市场中的竞争优势,这无疑是汤姆森路透的现有市场价值的侵蚀。

关于罗斯智能的论点是,使用其AI工具对公共利益有积极影响,法官认为,尽管法律意见本身是公开的,但“法学”作为汤姆森路透的增值服务,但不应通过未经授权的使用来削弱其市场价值。版权法的目的不仅是为了保护公共利益,而且是激发创作者通过市场机制获得回报的目的。因此,公共利益不是侵权的原因。

04

反射

(i)此案的影响

此案是关于合理使用原则是否保护使用受版权保护的材料来培训AI的第一个重要法院意见,为类似裁判提供了想法,这将促使整个AI行业更加关注数据的版权问题,无论是其他领域的合法AI还是AI。

但是,值得注意的是,法官的分析仍然仅限于非将军AI场景(专注于数据处理和分析,做出决策,分类,预测或建议,但不产生原始内容),以及对更流行的生成AI的合理使用辩护(基于从数据中学到的模式,为全新的文本,图像,图像,视频,音乐或其他内容而产生不同的情况)。

在技??术特征方面,非将军AI更多地依赖于监督学习,并且需要大量标记的数据来训练模型以学习输入和输出之间的映射关系。目的是对现有数据进行分类,预测,识别或做出决定,而不是生成新内容。输出结果通常是标签,类别或数值值。生成的AI通常基于无监督的学习或自我监督的学习,并通过大量未标记的数据来学习数据的潜在结构。目的是生成全新的内容,该内容类似于培训数据的分布,但具有创新性,输出结果包括文本,图像,音频,视频等。

(ii)相关案例

在美国,此案是关于合理使用原则是否保护使用受版权保护的材料来培训AI的第一个法律意见,并且具有重要意义。但是,在这种情况下,合理使用判断仍然更多地取决于生成的文本和原始文本的比较。该措施仅适用于一些易于比较的非生成AI的输出结果,以及对生成AI产品的判断的参考意义,而生成AI的产品更难识别和去识别。 2024年11月29日,多伦多之星和其他加拿大主要媒体组织共同起诉了著名的通用AI开发商,声称他们未经允许使用了受版权保护的新闻文章培训软件,而这些培训软件构成侵权,诉讼总额可能达到数十亿美元。可以预见的是,这种诉讼的结果将是使用生成AI培训数据的版权问题的更多参考价值。

在中国,当前的法律法规暂时没有关于人工智能培训数据的版权问题的直接和具体规定,但只有一些广泛的解释,例如“为了管理人工智能服务管理的临时措施,第7条规定”规定:”另一方面,中国的司法实践目前着重于AI模型最终产出结果的版权侵权问题。关于AI模型训练过程中的数据使用行为是否构成版权侵权,仍然没有明确的确认。 2024年6月20日,北京互联网法院对涉及该国的大型模型培训的第一个版权侵权案件进行了审判。该案是四名插图画家针对和Trik软件的主要公司提起的诉讼,指责他们在没有授权的情况下收集和存储工作,并将其用作AI培训材料。侵犯其版权权利,信息网络传播权和其他权利的类似图片的行为。最近,Iqiyi向Xuhui地区人民法院提起诉讼,指责该公司发达的海螺AI涉嫌侵犯AI模型培训和内容生成过程中的关键点。暂时以上两种情况没有进一步的判断,值得进一步关注。

(iii)域外法规

2024年5月,日本文化事务局的网站发布了“对日本人工智能和版权的一般理解”,该网站将人工智能的使用划分为“学习与发展阶段”以及“生成和使用阶段”,并强调并不是所有的培训行为都是合理的,并且在特殊场景中仍然构成侵权。 [3]但是总体而言,日本的政策倾向于促进AI行业的发展,并削弱了对工程权利的保护。

在人工智能培训数据中的版权方面,欧洲主要调节欧盟立法的版权以及成员国国内法律的依和应用。欧盟发布的“单一数字市场版权指令”规定了文本和数据挖掘的版权例外,包括“出于科学研究目的”和“在作品中合法获得,权利持有人都没有有效保留权利”。此外,尽管“欧盟人工智能法案”并未直接定义培训数据版权的所有权,但它规定培训数据必须符合版权法律和其他法律,以及创建数据集以培训AI模型以应用TDM(文本和数据挖掘)例外,以确保数据源以确保数据源和 数据。但是,从立法角度来看,欧盟对人工智能培训数据的版权保护比其他法律管辖区更为严格,并且具有更大的保护努力。但是,在2024年9月,德国汉堡地方法院听到的莱昂案中,莱昂(Laion)在未经授权的情况下将摄影师的作品用作AI培训数据。法院裁定,它构成了“科学研究目的的例外”,并且不构成侵权,为AI培训数据版权纠纷的审判提供了参考。 【4】

新加坡的版权法在2021年进行了修改,以引入基于目的的TDM例外,适用于商业和非商业用途。此例外仅限于特定行为(在有限情况下复制,传播,沟通),并且不受合同条款的约束,但是此例外只能适用于计算数据分析的目的。 (《版权法》第244(2)(b)条)。此外,在新加坡的“合理使用”例外,TDM行为也可以免除。版权法第184条清楚地指出,计算数据分析异常和“合理使用”例外是独立运行的。

美国第107条版权法规定了在判断合理使用时要考虑的四个要素。它们可以适用于人工智能培训数据的版权判断。如果人工智能培训数据本质上不是商业化,不会损害原始工作的市场价值,也不会使用原始工作的实质性表达或核心内容,则可以认为是合理的使用。

目前,美国有许多相关案件。对于盖蒂图像起诉AI,AI被指控在未经许可培训其AI模型的情况下复制超过1200万张图像和元数据,甚至篡改版权管理信息。尽管在这些情况下尚未取得进展或结果,但鉴于美国版权法提供了四个灵活的要素来确定合理使用,因此法院有可能做出最终决定。 【5】

摘要如下:

欧盟

日本

新加坡

美国

AI生成的内容保护

人类创造的一部分受保护

完全排除AI生成的内容

长安镇律师?敬请于评论区发表高见,并对本文予以点赞及转发,以助广大读者把握法律与正义的界限。

技术支持: 建站ABC | 管理登录