首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI 版权大战迎重磅判决!美国法院裁定 Anthropic 使用版权内容训练模型属合理使用,但存储盗版文件构成侵权

AI 版权大战迎重磅判决!美国法院裁定 Anthropic 使用版权内容训练模型属合理使用,但存储盗版文件构成侵权

作者头像
不二小段
发布2026-04-09 16:06:46
发布2026-04-09 16:06:46
2150
举报
文章被收录于专栏:不二小段不二小段

AI 与版权的世纪之战,终于迎来了一记决定性的重磅判决!

就在北京时间 6 月 24 日,美国加州北区联邦法院法官 William Alsup,就三位作家诉 AI 独角兽 Anthropic 侵权一案做出关键裁决。这场判决,无疑是向整个生成式 AI 行业投下了一颗深水炸弹。

Anthropic sued by authors over alleged misuse of copyrighted works for AI  training – Computerworld
Anthropic sued by authors over alleged misuse of copyrighted works for AI training – Computerworld

核心结论可以概括为一句话:一半是火焰,一半是海水。

  • 对 AI 公司有利: 法官明确裁定,Anthropic 使用受版权保护的书籍来训练其大语言模型 Claude 的行为,属于美国版权法下的「合理使用」(Fair Use)。同时,将合法购买的纸质书扫描成数字副本用于内部研究,也被认定为合理使用。
  • 对 AI 公司不利: 然而,Anthropic 从盗版网站下载数百万本书籍并将其永久存储在其「中央数据库」中的行为,不属于合理使用,构成了对作者版权的侵犯

这份判决,是美国法院首次就「使用版权数据训练生成式 AI 模型是否构成合理使用」这一核心问题做出明确而细致的裁决。它没有一刀切地判定输赢,而是将 Anthropic 的行为链条——获取、存储、训练——逐一剖析,给出了清晰的法律定性。

判决直接戳破了 AI 公司试图用「最终用途的变革性」来掩盖「上游侵权行为」的法律幻想。法官 Alsup 在判决书中掷地有声地写道:「《版权法》中没有为 AI 公司开辟的例外条款。」

这一判决,不仅直接关系到 Anthropic 的命运,更对 OpenAI、Google、Meta 等所有依赖海量数据投喂的大模型公司,以及千千万万的内容创作者,都将产生深远影响。

有人认为,这是AI行业期待已久的「绿灯」,也有人指出,判决中的「红线」同样清晰。

那么,法官的裁决逻辑何在?判决书中揭露了哪些 Anthropic 内部令人震惊的操作?它又将如何重塑 AI 产业的未来格局?

让我们一同深入这场风暴的中心。

分裂的判决:训练有理 vs. 盗版原罪

这次诉讼的原告是三位作家和记者:Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson。他们于 2024 年 8 月提起集体诉讼,指控由亚马逊和谷歌等巨头支持的 Anthropic,在未经许可、未支付报酬的情况下,使用了他们作品的盗版版本来训练其明星产品——大语言模型 Claude。

法官 William Alsup 的判决书,精准地将 Anthropic 的行为分成了三种「使用」场景,并分别适用「合理使用」原则进行审判。

场景一:模型训练——「极具变革性」,构成合理使用

对于将书籍内容用于训练 LLMs 这一核心行为,法官站在了 Anthropic 一边,认为其具有「极高的变革性」。

他写下了一段极富文学色彩的判词:

就像任何渴望成为作家的读者一样,Anthropic 的大语言模型训练这些作品,目的不是为了超越、复制或取代它们——而是为了实现一次艰难的转折,创造出一些截然不同的东西。

法官强调,原告并未指控 Claude 的输出内容直接复制或构成了对他们作品的侵权。Claude 只是学习了写作的模式、风格和结构,这与人类学习并无本质不同。因此,训练过程本身,以及在此过程中产生的临时复制(如数据清洗、分词等),均被认定为合理使用。这无疑是整个 AI 行业的一场巨大胜利。

场景二:扫描已购书籍——「格式转换」,也算合理使用

Anthropic 不仅从盗版网站获取数据,还花费数百万美元购买了数百万本实体书。他们将这些书的书脊撕掉,逐页扫描成 PDF 文件,然后丢弃了纸质原件。

法官认为,这种「破坏性扫描」仅仅是格式转换。因为 Anthropic 已经合法购买了这些书,将它们从实体变为数字形式,主要是为了节省存储空间和便于内部搜索。在这个过程中,副本数量没有增加(数字版取代了实体版),且没有对外分发。因此,这一行为同样被认定为合理使用。

场景三:下载并永久存储盗版书——赤裸裸的侵权

判决最严厉的部分,直指 Anthropic 的「原罪」——盗版

判决书披露,Anthropic 为了「避免『法律/实践/商业上的麻烦』」,选择从一开始就窃取书籍。他们从 Books3、LibGen 和 PiLiMi 等知名盗版网站下载了超过七百万本盗版书籍。

关键在于,Anthropic 不仅下载了,还计划将它们在一个名为「通用数据区」的中央图书馆里「永久存储」。即便后来决定某些书籍不再用于训练,这些盗版副本依然被保留下来。

法官 Alsup 对此予以猛烈抨击。他明确指出,为了建立一个通用研究图书馆而盗版书籍,其本身就是一种侵权使用,而且不是变革性的使用。它直接取代了本应付费购买的市场。

法官驳斥了 Anthropic 试图用「训练」这一最终目的来洗白其盗版行为的论点:「几乎没有任何侵权人能够解释,为什么从盗版网站下载那些本可以合法购买或获取的源副本,对于任何后续的合理使用来说是『合理必要』的。」

最终,法院裁定,Anthropic 下载和保留盗版副本的行为不构成合理使用,需要为此承担侵权责任,并面临审判。

风暴之眼:「合理使用」的四要素之争

要理解这场判决的深远意义,我们必须回到其核心法律概念——「合理使用」(Fair Use)

这是美国版权法中的一项重要原则,它允许在某些情况下,未经版权所有者许可使用其作品。法院在判断是否构成「合理使用」时,通常会综合考量四个因素:

  1. 1. 使用的目的和性质:是商业性的还是非营利性的?是否具有「转换性」?
  2. 2. 版权作品的性质:作品是事实性的还是创造性的?创造性越强的作品,保护范围越广。
  3. 3. 使用部分的数量和实质性:使用了原作的多少内容?是否触及了原作的核心部分?
  4. 4. 使用对原作潜在市场或价值的影响:使用行为是否会损害原作的市场,或取代原作?

在此次判决中,法官 Alsup 的分析深度聚焦于第一和第四个因素。他认为训练过程的「转换性」足够强,从而满足了第一要素;但同时,他也认为,允许 AI 公司永久存储这些盗版作品,将对作者作品的潜在市场(例如销售市场和授权市场)构成直接损害,因此在第四要素上完全不利于 AI 公司。

这场判决,实际上为「合理使用」在 AI 时代的适用,划定了一个模糊但关键的界限。它似乎在说:你可以为了学习而「阅读」(训练),但你不能把「偷来」的书永远放在你的书架上(存储)。

不止 Anthropic:一场席卷全行业的诉讼浪潮

Anthropic 案的判决只是冰山一角。事实上,整个生成式 AI 行业都深陷版权诉讼的泥潭之中。

  • 新闻业 vs AI: 《纽约时报》诉 OpenAI 和微软案,指控其非法使用数百万篇文章进行训练,生成的摘要和内容直接与其业务竞争。
  • 文学界 vs AI: 美国作家协会(Authors Guild)组织了包括《权力的游戏》作者乔治·R·R·马丁在内的多位知名作家,对 OpenAI 提起集体诉讼。
  • 视觉艺术 vs AI: 知名图库 Getty Images 诉 Stability AI,指控其非法抓取了 1200 万张图片,甚至 AI 生成的图片中还出现了 Getty Images 的扭曲水印。
  • 音乐界 vs AI: 环球音乐等主要音乐出版商,同样以歌词侵权为由,将 Anthropic 告上法庭。
Getty Images Sues AI Image Generator Stable Diffusion for Copyright  Infringement in the US
Getty Images Sues AI Image Generator Stable Diffusion for Copyright Infringement in the US

诉讼方

被诉方

核心领域

关键指控

Andrea Bartz 等作家

Anthropic

文学

非法使用盗版书籍训练 Claude 模型

《纽约时报》

OpenAI, 微软

新闻

非法使用文章训练,生成内容构成市场替代

美国作家协会

OpenAI

文学

大规模、系统性地盗用书籍进行模型训练

Getty Images

Stability AI

视觉艺术

非法抓取数百万张图片训练,并侵犯商标权

环球音乐集团等

Anthropic

音乐歌词

非法使用受版权保护的歌词训练模型

在这些诉讼中,AI 公司无一例外地将「合理使用」作为核心辩护理由。而 Anthropic 案的判决,无疑为这场旷日持久的法律战,提供了第一个重要的参照系和风向标。

判决之后:AI 产业何去何从?

这记「分裂」的判决,将给 AI 产业带来深刻而复杂的连锁反应:

  1. 1. 数据来源的「原罪」将无处遁形: 判决最清晰的信号是:数据来源至关重要。AI 公司再也无法以「技术创新」为借口,对训练数据的来源和获取方式视而不见。使用盗版、破解或通过其他非法手段获取数据的行为,将面临巨大的法律风险。这将迫使整个行业进行数据供应链的合规性审查。
  2. 2. 「先买后用」的授权模式成为主流: 判决将极大地推动 AI 公司与内容所有者达成授权协议。既然「先偷后用」的路被堵死,那么「先买后用」就成了最安全、最合规的路径。可以预见,未来 AI 公司在数据上的投入将大幅增加,与出版商、新闻机构、图库等内容方的合作将成为常态。
  3. 3. 诉讼焦点转移:从「怎么用」到「从哪来」: 对于创作者而言,这场判决为他们指明了更有效的维权方向。未来的诉讼可能会减少对「训练是否变革性」的抽象辩论,而更多地聚焦于具体的侵权行为证据,例如:你能否证明你的数据来源是合法的?你是否非法保留了我的作品副本?
  4. 4. 技术与法律的赛跑: AI 公司可能会在技术上寻求变通,例如开发出不需要长期存储原始数据的训练方法。但法律的缰绳已经收紧。这场判决标志着生成式 AI 的「狂野西部」时代正在结束,一个更加注重规则、合规和商业平衡的新阶段已经到来。
结语:第一张多米诺骨牌倒下

需要强调的是,旧金山联邦地区法院的这一判决,并非终局,很有可能依然会有上诉。然而,作为第一份针对核心问题的司法判决,它的风向标意义不容小觑。

它没有简单地在「创新」与「版权」之间做出非黑即白的选择,而是试图在两者之间划出一条微妙的界限。它保护了AI技术探索未知的核心动力,也捍卫了创作者对其劳动成果的基本控制权。

它告诉所有 AI 从业者:技术的发展不能建立在对他人权利的践踏之上。你可以用前人的智慧去创造未来,但首先,你需要对这些智慧给予应有的尊重——至少,是合法的获取。

对于 Anthropic 而言,虽然在核心的「训练」问题上获得了支持,但其「盗版原罪」被公之于众并被判定侵权。接下来,他们将不得不就盗版行为造成的损害赔偿问题,与作者们在法庭上继续交锋。

第一张多米诺骨牌已经倒下。对于牌桌上的每一个玩家——无论是AI巨头、初创公司,还是内容创作者——游戏规则都正在发生改变。

参考来源

Bartz v. Anthropic PBC (3:24-cv-05417) District Court, N.D. California | https://www.courtlistener.com/docket/69058235/bartz-v-anthropic-pbc/

Anthropic wins key ruling on AI in authors’ copyright lawsuit | https://www.reuters.com/legal/litigation/anthropic-wins-key-ruling-ai-authors-copyright-lawsuit-2025-06-24/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 分裂的判决:训练有理 vs. 盗版原罪
  • 风暴之眼:「合理使用」的四要素之争
  • 不止 Anthropic:一场席卷全行业的诉讼浪潮
  • 判决之后:AI 产业何去何从?
  • 结语:第一张多米诺骨牌倒下
  • 参考来源
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档