找回密码
 立即注册
查看: 697|回复: 2

OpenAI又摊上事了!大英百科状告ChatGPT:查资料也算侵权 ...

[复制链接]

25

主题

14

回帖

119

积分

注册会员

积分
119
发表于 2026-3-23 09:16:01 | 显示全部楼层 |阅读模式
新智元报道1 G- m7 l0 z1 t9 x' u" X
编辑:倾倾+ a8 D2 g# v- a# l$ u
【新智元导读】3月16日,大英百科全书联合韦氏词典,起诉了OpenAI,并且罗列了ChatGPT的「四宗罪」。不要觉得Britannica心狠,此前ChatGPT编造错误信息,却把来源伪托给Britannica。OpenAI未作回应。
: E& [6 M& y* b7 AOpenAI又被起诉了。
, u" b" U; B7 o2 v$ S3月16日,大英百科全书联合旗下的韦氏词典,对OpenAI提起诉讼。
; h0 I: [% b6 h5 X# y- \1 o  M5 m2 g5 b原因是,它认为ChatGPT进行了大规模的版权侵权。
; I! _3 ]9 N) o" H! d* o: jBritannica比所有原告准备得更充分:它紧抓训练数据抓取、模型记忆输出、RAG实时检索,同时追加《兰纳姆法》商标侵权。
  h! \. W: D; r' I; \8 ?这是AI版权诉讼史上,第一次有人试图把整条生成链路一锅端。6 v- A% W5 G8 h) z8 H% g& r/ `: R
GPT-4能逐字默写大英百科9 A; S# w' j: q0 u4 R
根据TechCrunch报道,Britannica直接点名GPT-4,认为它已经记住了其大量版权内容,能够按需输出近乎逐字逐句的复制品。" y$ b0 ?% F) s& N/ O$ j$ ~& N& ]
不是相似,不是接近,是逐、字、复、制。
$ t: \. M+ q8 B- S) I& `这背后有一定的技术依据。斯坦福和耶鲁的研究团队曾做过实验,从主流大模型中提取《哈利·波特》原文,最高提取率达到96%。( {$ {. T* u. W  A6 l

! u/ d' ]- z/ J; A/ Z4 @" r8 ~
- J5 f6 s& _" g7 Q; p也就是说,训练数据里的内容,有相当一部分被记在了模型权重里,在特定提示词下可以几乎原样还原。- E$ a/ A! }) J$ I( N; E6 y, e
Britannica持有的版权内容规模并不小。它旗下近10万篇在线文章、百科条目和词典释义,覆盖从科学、历史到文学的几乎所有主要知识领域。2 u9 D3 U: |2 r7 _( T+ b$ q
这些内容由专业编辑和学科专家历经数十年积累而成。在维基百科崛起之前,这套体系就是人类知识的标准索引。7 y, n& e; i: N" u/ r2 C/ d
而OpenAI一直在灰色地带游走。
6 O1 n/ t5 z4 U' f6 i0 q* J& B查一次资料,也算侵权
& v9 R% X  @& q; g9 \$ A  u此前,各方一直在争论:用我的内容训练模型,算不算版权侵权?/ e+ g4 v) @; O2 z9 T' G$ y7 q/ n" l
Britannica这次的指控更进一步。他的指控分三层:
, j+ f9 a; F0 Z+ T第一层,未经许可抓取近10万篇内容用于大模型训练。
" }% r' G1 p+ {1 ?$ p& N% E0 G第二层,ChatGPT在生成回答时,输出了Britannica内容的完整或部分逐字复制,这构成直接侵权。; a/ p# q6 O6 b3 J4 M7 C
第三层,也是最具争议的一层。OpenAI在ChatGPT的RAG工作流中使用了Britannica文章。
" p- \: f- |# O% c% B+ {, Q  q0 yRAG是ChatGPT扫描外部数据库、获取最新信息的机制。( |* |; Z1 h0 N6 i6 f

% M7 m1 }0 O9 g- m8 P
5 o/ s7 U3 C. n; S' z% rBritannica认为,即便它的内容没有进入训练集,但只要它出现在实时检索里,就被视为侵权。" i3 ~/ W5 r) |
这种想法前所未有,它意味着不管是静态训练还是动态检索,只要调用了版权内容而未获授权,都要负责。
3 u- a# p+ v1 l: \" Q更有意思的是第四条指控:Lanham Act商标侵权。+ R: z1 W' ^9 n0 R1 R8 M  `
Britannica认为,ChatGPT有时会产生幻觉,然后把这些错误内容归因于Britannica,制造Britannica生成了错误信息的假象。
, z0 v% K. |3 g: b( y, s这不单单是侵权,Britannica的品牌信誉都要替OpenAI的错误买单。
; v+ M9 }, M# ~! @4 d+ v这危及公众持续获取高质量、可信赖在线信息的能力。
) E, d  X- G+ b同一个问题:德国说侵权,英国说没有" U: f, h+ n" f; i- h
这是整场官司的核心,也是目前全球司法界争论最激烈的问题之一。
+ }) U" D8 \3 U; z德国慕尼黑法院在GEMA诉OpenAI案中认定:GPT-4和GPT-4o的模型权重中确实嵌入了歌词,这构成版权意义上的复制,可以提出禁令和赔偿请求。1 l5 \/ j6 K$ E3 V" E

4 T8 n0 z; s8 @0 i7 w/ o& y1 x) O  i) E- A2 S
模型权重是AI在训练过程中学到的数值参数,它决定了模型会输出什么。在慕尼黑法院看来,只要能从这些参数里还原出作品就足以构成侵权。' _9 i% K! B' ~$ I* D3 h# N/ @: r
英国高等法院在Getty Images诉Stability AI案中得出了完全相反的结论。
/ s2 \, ?% z* f7 w+ M3 v% z
8 s: s, e  h) r- ?/ F3 o* E. M7 l8 m9 q. l  Q. m6 W
AI模型不是侵权副本,因为其权重既不包含也不复制版权作品本身,只存储了学习到的规律性模式。
! w& Q4 q5 k& y2 }/ E2 K2 U' m' c美国这边,Anthropic曾在版权诉讼中说服联邦法官William Alsup,认定将内容用作训练数据具有足够的转化性,可以适用合理使用原则。
- r5 Y3 U: {7 ?% q: I但Alsup同时认定Anthropic非法下载了数百万本书而非付费获取,这一点构成违法,最终促成了1.5亿美元的集体和解。
* H& A/ o, g" c% a! JBritannica这起案子在纽约提起,适用的是美国联邦法律。7 ?9 E) K; @1 X# B  u
但目前没有确立性先例明确说明用版权内容训练LLM究竟算不算侵权,每起案子的结果,在相当程度上仍取决于具体法官的认定逻辑。
1 j5 Z& X* s9 R如果法院认可实时检索也构成侵权,那对整个AI行业的影响将远超任何一起训练数据纠纷。
% l# U7 {% C+ r% ]告Perplexity,是在给OpenAI热身& X- _  m8 d$ a
这不是Britannica第一次出手。% G1 [: n, d0 C# C
早在2025年9月,Britannica就对Perplexity提起了类似的版权和商标侵权诉讼,该案目前仍在审理中。
5 x9 G) @; T$ Z, r8 c4 {( k* u) d0 [+ H

* D# n. ?3 C+ T6 w: S  SPerplexity是一家以RAG为核心产品逻辑的AI搜索公司。
8 b4 O: c3 r( sBritannica选择先打Perplexity,像是在做法律预演,摸清RAG侵权这条路的可行性,然后再把同样的逻辑复制到OpenAI身上。
8 y: j1 Z! [1 o0 E6 X5 h- O与此同时,行业里的版权战场正在全面升温。
7 v* f5 M! F8 T2 ]3 g" f  q: }《纽约时报》、Ziff Davis、美国和加拿大十余家报纸先后起诉OpenAI。4 F1 ]2 K4 R! e- o
6 h. F+ w( [2 o( K4 ], v! @

% V1 r8 S$ y# b4 m" _) _The Intercept和US News & World Report也已加入原告队伍。
9 A: W, l) Z! i7 b截至目前,专门追踪AI版权诉讼的网站ChatGPT Is Eating The World统计显示,这已是针对OpenAI的第63起版权诉讼。0 e6 k( w6 x) Q/ E. m
OpenAI对TechCrunch的置评请求未作回应。( j' }& i/ d; B
被维基百科打残,又被ChatGPT截流  K) a$ ~+ f4 J+ m  c, k
退一步看,有些事情比赔偿金额更值得关注。
" }3 {6 Z* s% ^% x" M5 e8 u; eBritannica创立于1768年,是英文世界里持续时间最长的百科全书品牌,它代表的是几百年人类知识整理传统的某种象征。4 p: z# X8 u" S( [, ?2 L( R
当这样一个机构出现在AI版权诉讼的原告席上,传递的信号很清晰:知识权威这个概念,正在试图通过法律手段,重新在AI生态里划定自己的边界。+ G9 c/ L( j# \; ^6 w. Q& r# y
Britannica曾是纸质百科时代的绝对权威,被维基百科打得几乎找不到存在感。$ m( Y4 W% S; }) F" E

+ c9 W! A3 L, p2 L7 e" {# _" _8 E
后来转型为数字订阅平台,靠着内容的可信度和专业性重新站稳脚跟。
  U# D$ U8 X7 O5 Z8 l1 g如今,ChatGPT的出现让它又一次面临被替代的威胁——但不是被更好的百科替代,而是被一个用它内容训练出来、但不分给它一分钱的模型替代。
$ B9 I3 t/ w; K" u4 P3 X) A# a诉状里有一句话:
8 W) a+ U5 o$ X" K! x/ XChatGPT通过生成替代出版商内容的回复,抢走了出版商的流量。
; y; g9 _: ]9 x9 W这是商业模式的正面冲突。RAG这条指控是否能站住脚,目前没有人能给出确定答案。. ]5 x3 ^1 \7 L* z5 |! l
但如果法院哪天认可了这个逻辑,整个行业的实时检索管道都需要重新谈授权。9 u$ S$ ?7 w8 _  n: _9 g
所有以联网搜索+AI生成为核心产品的公司,都要面临这样的问题。( _4 ^7 f3 `3 t' ]+ K9 e
250年的老牌百科,正在用一份诉状,尝试给AI的边界划一条线。3 n5 b9 c# @* S6 J4 Z0 u( o* ]2 }
这条线最终画在哪里?2026年,大概会有答案。% _3 |4 Y% \5 [( U2 C
参考资料:
% G) R; q$ `) ^: \! Khttps://www.reuters.com/legal/litigation/encyclopedia-britannica-sues-openai-over-ai-training-2026-03-16/4 `4 r; [9 A! r
https://techcrunch.com/2026/03/16/merriam-webster-openai-encyclopedia-brittanica-lawsuit/+ Q8 v% Q& s3 P
https://the-decoder.com/encyclopedia-britannica-sues-openai-for-training-on-nearly-100000-articles-without-permission/
  w# o6 j* }$ {, i: Phttps://gizmodo.com/encyclopedia-britannica-sues-openai-over-ai-training-data-2000607770! ?1 Q" o) t$ {
https://news.bloomberglaw.com/ip-law/britannica-merriam-webster-accuse-openai-of-copying-thEIr-works
+ H8 v& y3 r8 Q8 t; j3 yhttps://chatgptiseatingtheworld.com/wp-content/uploads/2026/03/Encyclopedia_Britannica_Inc-v-OpenAI-COMPLAINT-Mar-13-2026.pdf
3 e" F4 Y2 c8 I6 Ghttps://www.aol.com/articles/encyclopedia-britannica-sues-openai-over-141324436.html
集群智慧云科服专利申请服务

37

主题

10

回帖

146

积分

注册会员

积分
146
发表于 2026-3-23 09:16:30 | 显示全部楼层
anthropic超越openai 迟早的事,openai还没盈利就开始得大公司病,anthropic聚焦编程,不急不躁,没有舆论压力。
集群智慧云科服SCI/SSCI/EI期刊发表服务

36

主题

16

回帖

175

积分

注册会员

积分
175
发表于 2026-3-23 09:16:59 | 显示全部楼层
竟然是openai[喷水]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表