找回密码
 立即注册
查看: 752|回复: 2

OpenAI又摊上事了!大英百科状告ChatGPT:查资料也算侵权 ...

[复制链接]

86

主题

43

回帖

395

积分

中级会员

积分
395
发表于 2026-3-23 09:16:01 | 显示全部楼层 |阅读模式
新智元报道
8 e( L2 q" I# u5 L# ?编辑:倾倾
' X! ^3 i4 D# X& s! \$ q7 W【新智元导读】3月16日,大英百科全书联合韦氏词典,起诉了OpenAI,并且罗列了ChatGPT的「四宗罪」。不要觉得Britannica心狠,此前ChatGPT编造错误信息,却把来源伪托给Britannica。OpenAI未作回应。2 `  d+ P) I1 [) w. v! l
OpenAI又被起诉了。
% W3 ^: M' _0 Z1 i( j3月16日,大英百科全书联合旗下的韦氏词典,对OpenAI提起诉讼。
$ ~' V* K- g6 f9 K/ x4 u& s- }3 f原因是,它认为ChatGPT进行了大规模的版权侵权。* Y+ [6 n* g" J% U) [
Britannica比所有原告准备得更充分:它紧抓训练数据抓取、模型记忆输出、RAG实时检索,同时追加《兰纳姆法》商标侵权。
7 l/ r. I9 t7 P4 a, \这是AI版权诉讼史上,第一次有人试图把整条生成链路一锅端。
# {; I: E7 i. A) H  WGPT-4能逐字默写大英百科9 q; V/ m1 F8 }" u7 i
根据TechCrunch报道,Britannica直接点名GPT-4,认为它已经记住了其大量版权内容,能够按需输出近乎逐字逐句的复制品。
# Q5 }0 ^, C4 u" L不是相似,不是接近,是逐、字、复、制。
% ?# o; f2 |8 O3 C( U这背后有一定的技术依据。斯坦福和耶鲁的研究团队曾做过实验,从主流大模型中提取《哈利·波特》原文,最高提取率达到96%。  W6 m4 G1 P; [+ a$ |# r
$ h7 C) }8 v  R- J; f

  P: ?. G9 y% d也就是说,训练数据里的内容,有相当一部分被记在了模型权重里,在特定提示词下可以几乎原样还原。
3 c$ G% S( h. H3 rBritannica持有的版权内容规模并不小。它旗下近10万篇在线文章、百科条目和词典释义,覆盖从科学、历史到文学的几乎所有主要知识领域。
$ X* E9 I  T: ^# F$ J这些内容由专业编辑和学科专家历经数十年积累而成。在维基百科崛起之前,这套体系就是人类知识的标准索引。
  m# K' ^, w4 a+ r. A  c而OpenAI一直在灰色地带游走。" S8 H9 S' J& C; P' m
查一次资料,也算侵权& w4 A" y$ B% L: e9 ^; o& X
此前,各方一直在争论:用我的内容训练模型,算不算版权侵权?
( p9 J$ ^8 F: t8 qBritannica这次的指控更进一步。他的指控分三层:
) {7 r6 X8 e3 N: x5 M7 b第一层,未经许可抓取近10万篇内容用于大模型训练。
: ^- G# [0 M( N: S第二层,ChatGPT在生成回答时,输出了Britannica内容的完整或部分逐字复制,这构成直接侵权。
5 Q; A/ r5 S. E" k5 P+ V' U第三层,也是最具争议的一层。OpenAI在ChatGPT的RAG工作流中使用了Britannica文章。+ A8 `  p7 F3 a' ^$ X1 {# c
RAG是ChatGPT扫描外部数据库、获取最新信息的机制。
* F8 c, `8 e7 Q" e4 A# f' z* R) [0 w
! w) z% h9 |! |# ~% e0 \$ U. y
Britannica认为,即便它的内容没有进入训练集,但只要它出现在实时检索里,就被视为侵权。9 b" s# ^) N3 E: k
这种想法前所未有,它意味着不管是静态训练还是动态检索,只要调用了版权内容而未获授权,都要负责。
1 p! w$ T% B) v( M8 D更有意思的是第四条指控:Lanham Act商标侵权。6 Y' w/ ]% S/ S4 {" t% u# l0 X5 K% O
Britannica认为,ChatGPT有时会产生幻觉,然后把这些错误内容归因于Britannica,制造Britannica生成了错误信息的假象。
* k" \% w9 n- u# p这不单单是侵权,Britannica的品牌信誉都要替OpenAI的错误买单。
" B7 v1 x5 n1 C4 _3 H4 F这危及公众持续获取高质量、可信赖在线信息的能力。
2 v: d) A, M! z/ X' b. Y同一个问题:德国说侵权,英国说没有
3 H/ T8 ^6 {1 V8 \  I$ n7 o8 o这是整场官司的核心,也是目前全球司法界争论最激烈的问题之一。
* F* |' g+ b7 _- r1 J8 U0 K, w德国慕尼黑法院在GEMA诉OpenAI案中认定:GPT-4和GPT-4o的模型权重中确实嵌入了歌词,这构成版权意义上的复制,可以提出禁令和赔偿请求。) B# f1 T3 ]9 T- |( A- j+ Z
7 e* Q) f& Q; l2 F* a( L3 h6 v

: E! w& {$ t1 A8 R3 c; V; `模型权重是AI在训练过程中学到的数值参数,它决定了模型会输出什么。在慕尼黑法院看来,只要能从这些参数里还原出作品就足以构成侵权。
1 t: L/ w: S- N$ M! \/ K英国高等法院在Getty Images诉Stability AI案中得出了完全相反的结论。
7 A3 s. l( p, N6 E* s) f  O, b9 g- b+ X
$ D) L7 c+ ^" a; Y5 y2 \, a
AI模型不是侵权副本,因为其权重既不包含也不复制版权作品本身,只存储了学习到的规律性模式。
0 _3 k' T; |( Y美国这边,Anthropic曾在版权诉讼中说服联邦法官William Alsup,认定将内容用作训练数据具有足够的转化性,可以适用合理使用原则。
! Q0 U* [; c. n5 R但Alsup同时认定Anthropic非法下载了数百万本书而非付费获取,这一点构成违法,最终促成了1.5亿美元的集体和解。
3 o9 K/ Z' S' M0 t, u; p9 C: Y# W; TBritannica这起案子在纽约提起,适用的是美国联邦法律。
+ S, |" q% G9 _" ~* H4 f但目前没有确立性先例明确说明用版权内容训练LLM究竟算不算侵权,每起案子的结果,在相当程度上仍取决于具体法官的认定逻辑。
9 L9 M; f- w; F8 a# ?  T如果法院认可实时检索也构成侵权,那对整个AI行业的影响将远超任何一起训练数据纠纷。4 k- q( Y( S# x  f! b
告Perplexity,是在给OpenAI热身: r! n% |, E$ v/ b2 i
这不是Britannica第一次出手。
  x% H' ~! U$ j* k* ]1 a早在2025年9月,Britannica就对Perplexity提起了类似的版权和商标侵权诉讼,该案目前仍在审理中。4 Q# H" T* z4 c3 q* x

" ?5 \  N* i- E1 B2 F
) {( X; {& u2 B4 B/ h. kPerplexity是一家以RAG为核心产品逻辑的AI搜索公司。% S% W! h  D5 y
Britannica选择先打Perplexity,像是在做法律预演,摸清RAG侵权这条路的可行性,然后再把同样的逻辑复制到OpenAI身上。
* S. ]/ w9 I8 f9 w与此同时,行业里的版权战场正在全面升温。' z# B% q! Q* y" }: a" L
《纽约时报》、Ziff Davis、美国和加拿大十余家报纸先后起诉OpenAI。
9 d: F0 A; ]& o. L
% B: O, ?6 F/ |  U% R' a  d7 E* R  w9 @. d' n( z& E' e* w
The Intercept和US News & World Report也已加入原告队伍。8 d& N5 @  ]+ ^
截至目前,专门追踪AI版权诉讼的网站ChatGPT Is Eating The World统计显示,这已是针对OpenAI的第63起版权诉讼。. W% |4 S' n/ x+ Q) R0 H* R3 u
OpenAI对TechCrunch的置评请求未作回应。; f6 t6 h# c& Y9 L
被维基百科打残,又被ChatGPT截流
  A: O3 k0 i2 Y+ ~; v3 T5 {退一步看,有些事情比赔偿金额更值得关注。
* t$ ~3 U) Z( T7 T8 ]. \- X& k0 N5 GBritannica创立于1768年,是英文世界里持续时间最长的百科全书品牌,它代表的是几百年人类知识整理传统的某种象征。# g) Q! j8 f, P: K9 m
当这样一个机构出现在AI版权诉讼的原告席上,传递的信号很清晰:知识权威这个概念,正在试图通过法律手段,重新在AI生态里划定自己的边界。
, c1 x8 J( E8 z, a/ h; aBritannica曾是纸质百科时代的绝对权威,被维基百科打得几乎找不到存在感。
- ~5 _. S( [- X% u/ @& j3 f; b( w- j& b2 X- k$ B

/ i3 L! B, B$ u, @" D- o' N后来转型为数字订阅平台,靠着内容的可信度和专业性重新站稳脚跟。
1 }6 X* d- y# u' y/ t如今,ChatGPT的出现让它又一次面临被替代的威胁——但不是被更好的百科替代,而是被一个用它内容训练出来、但不分给它一分钱的模型替代。
/ f3 F+ A! u1 O4 ]" y5 q4 x诉状里有一句话:8 |$ `  H' m1 j- D# {& b
ChatGPT通过生成替代出版商内容的回复,抢走了出版商的流量。4 i7 m0 ~6 l" |% I: M
这是商业模式的正面冲突。RAG这条指控是否能站住脚,目前没有人能给出确定答案。
- |+ \; n# C3 S4 u. c% h4 G9 B* m但如果法院哪天认可了这个逻辑,整个行业的实时检索管道都需要重新谈授权。
3 S3 [1 u- ~2 E( d7 ^所有以联网搜索+AI生成为核心产品的公司,都要面临这样的问题。' v' j0 S4 U3 q2 X. U1 M
250年的老牌百科,正在用一份诉状,尝试给AI的边界划一条线。
; G# n1 [8 [4 b这条线最终画在哪里?2026年,大概会有答案。
  O  g# h4 c6 Y) @' H8 _参考资料:  Z: ?- V6 }1 n% z% d8 v
https://www.reuters.com/legal/litigation/encyclopedia-britannica-sues-openai-over-ai-training-2026-03-16/
8 [5 L0 b, P6 n/ R/ o" S# h. Bhttps://techcrunch.com/2026/03/16/merriam-webster-openai-encyclopedia-brittanica-lawsuit/+ K. I- t( T' M7 A3 R8 _9 ?- _4 m
https://the-decoder.com/encyclopedia-britannica-sues-openai-for-training-on-nearly-100000-articles-without-permission/
2 L; ]* h3 Y  y: ?2 L7 D! I3 Whttps://gizmodo.com/encyclopedia-britannica-sues-openai-over-ai-training-data-2000607770+ m3 X" x7 ~% a6 g3 e
https://news.bloomberglaw.com/ip-law/britannica-merriam-webster-accuse-openai-of-copying-thEIr-works( a! u4 o9 z4 C7 b
https://chatgptiseatingtheworld.com/wp-content/uploads/2026/03/Encyclopedia_Britannica_Inc-v-OpenAI-COMPLAINT-Mar-13-2026.pdf; X$ I( P+ Y9 {( R+ J# G
https://www.aol.com/articles/encyclopedia-britannica-sues-openai-over-141324436.html
集群智慧云科服专利申请服务

90

主题

35

回帖

386

积分

中级会员

积分
386
发表于 2026-3-23 09:16:30 | 显示全部楼层
anthropic超越openai 迟早的事,openai还没盈利就开始得大公司病,anthropic聚焦编程,不急不躁,没有舆论压力。
集群智慧云科服SCI/SSCI/EI期刊发表服务

87

主题

34

回帖

379

积分

中级会员

积分
379
发表于 2026-3-23 09:16:59 | 显示全部楼层
竟然是openai[喷水]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表