找回密码
 立即注册
查看: 188|回复: 0

马斯克:搞不定AI5,特斯拉就完了

[复制链接]

2378

主题

5

回帖

1万

积分

管理员

积分
19370
发表于 2026-2-15 23:00:10 | 显示全部楼层 |阅读模式
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!: }3 i. P- ~6 [1 l
                (来源:网易科技)0 r5 N; U) X% o0 _
作者 |肖恩
2 I/ }6 v* O. K编辑 |德新) q: N0 Y# Z8 o! v7 D% f) Z# h* m
LUgU58i8u6XwA855.jpg
7 D) K. Y1 N$ n! U  t( J1 |+ E& s% EAI5不是一颗芯片' W! K0 \; ~/ z2 b+ u2 z- Z
尽管马斯克在公开场合称之为「AI5 Chip」,但在特斯拉的工程定义里,它是 HW 5.0 —— 第五代车载计算平台。+ }( V; v7 K# F% k7 w
2024 年 6 月,马斯克在 X 宣布 HW 5.0 改名为 AI5,沿用至今。时间来到 2025 年 11 月的股东大会上,马斯克说:“AI5 之后,不会再有下一代车载芯片了。”
! Q! S$ ?% ]$ `; q  R9 J3 i' ?8 J! ^7 R无人驾驶、人形机器人(17.560, -0.10, -0.57%)、数据中心,全压这一个平台。他的原话是“Solving AI5 was existential to Tesla”——关乎存亡。
% _* T) l9 J$ m0 n" q! Q- J换句话说:搞不定,特斯拉就完了。3 u& o$ o# Q$ [5 d  |+ r
一、一头怪兽
! |* M3 Y/ e* I0 a qu62W0v2OX02566w.jpg 3 l! k( D. Q' v! b! r6 Z+ R1 f
2025 年 6 月,一份疑似来自三星供应链的文档在韩国科技社区流出,列出了 AI5 的核心参数:  c! V  `3 M8 `( f1 I
PR2rOio10gu3esH0.jpg 8 r' w( p7 f. }. }( I
如果这些数字是真的,AI5 的性能逼近英伟达 H100。H100 卖 3 万美元,功耗 700 瓦,给数据中心用的。车载芯片做到这个水平?有点离谱。
) r) i* V2 c1 n特斯拉官方没有回应。马斯克自己在播客里开了口:"This is a beast. 这是一头怪兽。"$ Y4 `; C4 i! g2 M9 @6 X
Q3 财报会,他给出了更多细节:2 }+ C& |( G5 L0 d  C! E
2026 年 1 月,马斯克在 X 上直接对标英伟达:% h/ f, W3 \! e) G( d/ c- {
“单芯片大致是 Hopper 级别,双芯片是 Blackwell 级别,但成本极低,功耗也低得多。”
  R$ w5 K7 L) x( h; X7 o3 Z2 IHopper 推理算力约 4000 TOPS,功耗 700 瓦,而 Blackwell 算力翻倍到 9000 TOPS,功耗破千瓦。9 e# _1 w5 j" K. u8 g# {4 R
泄露的数字,被一步步坐实了。马斯克吹过的牛很多,这次似乎有点靠谱。
' h! _/ N& Z+ u% ?0 J+ y1 s4 `算力涨了 8 倍,推理性能却涨了 40 倍——中间差的 5 倍从哪来?答案是架构优化。4 f. x! K9 ^9 A4 N- L0 W7 s
马斯克举了一个例子:神经网络里有个操作叫 SoftMax,用来算概率分布。在 HW4 上要跑 40 个步骤模拟;AI5 硬件原生支持,几步就搞定。一个操作省了三十几步,乘以网络里几百万次调用,5 倍的差距来自于这里。/ ^6 }9 ~( D$ s" ]# F0 @' z
更激进的是做减法。AI5 直接砍掉了 GPU 和图像处理器(ISP)。
+ g9 G$ }% m% o& w: ]先说 ISP。摄像头传感器输出 12-bit 原始数据,4096 级亮度。特斯拉以前的做法是先用 ISP 处理成“好看的图像”再喂给神经网络——去噪、调色、压缩,信息会有损失。
7 Y, R7 ]5 x, }7 Y2 m7 y现在 FSD 绕过 ISP,从原始光子数据输入直接输出控制信号,信息更多,延迟更低。马斯克的原话是“我们不在乎图片好不好看,我们只要数据。”; B( [" q1 ~2 G2 b8 _, Q
再说 GPU。智驾芯片里的 GPU 通常干两件事:跑神经网络,渲染屏幕上的车道线和周围车辆。特斯拉把渲染扔给了座舱的 AMD Ryzen,FSD 芯片只干一件事:跑端到端神经网络。GPU 成了多余的面积,砍掉。
2 `- [2 G. O* p/ ^; @7 N- b砍完之后,芯片面积缩到光刻机单次曝光的一半——马斯克管这叫「半个光罩」。面积小,成本就低,良率就高,发热就少。省下来的晶体管预算?全砸推理单元。
9 Q7 ]4 l' i& y9 M% `" J3 `内存也在升级。HW3 用 LPDDR4,手机同款,带宽 70 GB/s。HW4 首次用了显卡内存 GDDR6,带宽拉到 384 GB/s。
- n# n, |! [( {7 M3 X& N' O' Q泄露显示 AI5 带宽达到 1.9 TB/s。如果属实,大概率用的是 HBM3——H100 同款的高带宽内存,把好几层 DRAM 堆叠焊在芯片上。车载平台用 HBM,行业第一个。
5 T% z  V( V2 @8 D马斯克的话中还透露了一个细节:AI5 会有单芯片和双芯片两个版本。
! t- f6 t/ C8 A7 R% _. e二、十倍参数的代价
5 {2 ]! W: S* h* J) B8 X/ L! m$ h7 F kM5SCjkkmjSsjV0L.jpg 6 e, M( |* ^( M
2025 年 6 月,马斯克透露特斯拉在测试一个 4 倍参数的新模型。两个月后他改口了:跳过 4 倍,直接上 10 倍。3 J- b$ T2 H1 p# H* ?6 e
"约 6 周后会有一个重大更新,参数量是原来的 10 倍。"
/ r; y' \- {8 `6 L8 ?10 月,FSD v14 如期推送。
6 s/ Q' B9 V; g5 v2 `6 F! W参数量涨 10 倍,算力、内存、带宽全得跟上。# F# y7 v! y- j0 Z2 R6 @, U
先说算力。* T* q$ l7 }. w4 k/ X
参数涨 10 倍,计算量也涨 10 倍。但 FSD 不是云端慢慢算的语言模型—— 8 个摄像头、每秒 36 帧、360 度视野,必须在几十毫秒内给出判断。算力不够,要么丢帧,要么延迟,要么降精度。
) l  p( y) C! x* O6 \# C3 GHW4 的算力约 300 TOPS。v14 通过激进优化勉强跑起来了,但已经是极限。想跑更大的模型?想加入推理能力让车"思考"而不只是"反应"?算力不够。
7 J. c! W0 o* D: i9 z$ h( ]5 V推理能力是下一代 FSD 的核心升级。马斯克在 Q3 财报会上说,v14.3 会让车"有知觉"。以前的 FSD 是条件反射:红灯停,绿灯走。现在要做因果推理:前面那辆车减速可能要右转,右边有行人在犹豫,综合判断我应该变道降速。! {. V, S& x+ z3 T' X: @# f
这种“思考”不是一次计算就能完成的。多步推演,评估多个可能性,模拟未来几秒的场景。每多想一步,算力消耗就翻倍。
1 G/ Q* s6 O6 [, L7 }1 bAI5 的推理性能是 HW4 的 40 倍。不是 8 倍、不是 10 倍,是 40 倍。多出来的部分,就是留给「思考」的。- Q4 H' A, B2 \" Y' s5 ~; r$ \+ L
再说内存和带宽。" G0 j& i" ]- ?
神经网络的每个参数都要占内存。量化后,每 1 亿参数大约吃掉 100MB。v14 完整模型需要约 12.5GB。HW4 有 16GB,已经接近模型运行的下限。而 HW3 只有 8GB,只能跑精简版。
* @9 z, o' z! Z, C) M" ?内存不只是装模型,还要装"记忆"—— 8 秒前那辆车在哪、行人往哪走、信号灯变了几次。特斯拉 AI 负责人 Ashok 说过,车载内存是限制上下文长度的主要瓶颈。想让车记得更久?先要把内存堆上去。
4 W3 M# F) P' n" o144GB,是 HW4 的 9 倍。够装更大的模型,还有余量留给更长的时间记忆。! @4 F7 s5 u0 }7 H
光有内存还不够,还得喂得快。
) h9 T/ B) a# R; L9 U9 t9 g神经网络推理时,每个参数都要从内存读到计算单元。模型跑一遍,参数读一遍。v14 模型约 12.5GB,每秒跑 30 次推理,每秒要读 375GB 数据。HW4 带宽 384 GB/s。刚好够。但也只是刚好。
3 |9 n, ^2 H1 X8 x* _模型再大 10 倍呢?每秒 3.75TB。HW4 的带宽无法支撑这样的规模。AI5 的 1.9 TB/s 带宽,就是为这个准备的。
. ]! e, K- X! O# M马斯克说,安全的无人驾驶需要 100 亿英里的训练数据。"现实世界的复杂性有超长的尾巴。"更大的模型才能装下这些长尾。
+ C7 \5 m" c' {4 ]回头看 AI5:40 倍推理性能,9 倍内存,5 倍带宽。全是余量。1 W! O9 g$ D) d& j" g
HW4 勉强撑住了 v14。AI5 是给下一个十倍准备的。, L5 n. R  G8 m, l$ M
三、165亿美元的赌注
# _' M, b5 k7 F2 C NFNATb4BHry4yT7y.jpg
5 u& c6 g8 |( f3 ~2025 年 8 月,三星和特斯拉签了一份 165 亿美元的代工合同。这是三星德州 Taylor 厂拿到的最大订单,也是特斯拉有史以来最大的芯片采购。! K$ f4 p& a0 E
AI5 的制造策略在半导体行业几乎没有先例:同一颗芯片同时交给三星和台积电。
* @- J5 \# B+ Z( k0 a' s# o8 a三星在德州 Taylor,用 3nm GAA 工艺;台积电在亚利桑那,用 3nm N3E 节点。马斯克公开说三星德州的设备比台积电亚利桑那「略微先进」。这话在半导体圈引起争议——台积电一直是先进制程的老大。) E6 H. o! y5 F% g
两家会生产“略有不同”的 AI5。工艺不同,但软件必须在两个版本上表现一致。
( ^3 a& U8 C' Z+ q$ e$ ]8 {6 L4 {双代工是为了产能,FSD、Robotaxi、Optimus 全部压在 AI5 上。不能把鸡蛋放一个篮子里。; Y3 W+ j( J8 G
2026 年 1 月,三星 Taylor 厂开始测试 EUV 光刻设备——这是生产 3nm 芯片的关键一步。特斯拉确认了 AI5 的时间表:2026 年底少量产出,2027 年大规模量产。
3 }, p6 J) p; `; a: }. a4 i8 l但时间线也很“马斯克”。2025 年 7 月马斯克说设计“已经完成”,半年后改口“几乎完成”。熟悉的配方。直接的结果是 2026 年 6 月投产的 Cybercab 首发只能用 HW4。特斯拉最重要的新车,赶不上最重要的新芯片。
; Y/ H7 e8 _1 D# Q( n为了填这个坑,特斯拉悄悄推出了 HW4.5。
/ T; u' J; g2 n# A$ r: T2026 年 1 月,部分 Fremont 工厂生产的 Model Y 开始搭载这个过渡版本,零件目录里标价 2300 美元。最大的变化是从双芯片升级到三芯片。长期研究特斯拉固件的黑客 Green 爆料说,特斯拉的代码里很早就有三芯片设计的引用,这不是临时起意。
: j" l! l2 a& @9 `; @. u/ \/ W2 F为什么要三颗?- x0 Q1 [/ O; X& ~  Y
最大的原因可能是算力,现在 FSD 的模型越来越大,HW4.0 经过大量优化后也只能勉强跑起来,在 AI5 到来之前模型还要迭代,因此需要一个算力稍大的平台过渡;另一个原因可能是为了冗余,三芯片可以实现投票决策,比双芯片更可靠。具体怎么用,还要等硬件上车后才知道。2 R( j$ g' [: h6 Q. L/ r
165 亿只是开始。马斯克在财报会上说:8 @0 o+ l9 g. L# g& v: w: \
"把供应商最乐观的产能预测加起来也不够。我们必须建一座 TeraFab——一个非常大的工厂,把逻辑芯片、内存和封装全放在一起。"
  P5 H& S2 \2 H3 Y% }% L特斯拉已经开始行动。SpaceX 在德州建先进封装设施,2025 年 9 月交付设备,目标 2026 年 Q3 有限生产,2027 年 Q1 全面量产。封装是芯片制造的最后一环,先拿下这一环,再建晶圆厂。* `) }. Q# k! i& b9 o: C5 K% k# c
TeraFab 的目标:月产 10 万片晶圆起步,最终 100 万片——台积电全球月产约 142 万片。马斯克的愿景是每年产出 1000 亿到 2000 亿颗芯片。3 Z& Q4 J8 d# y' {
这个数字远超现有半导体行业的产能经验。黄仁勋直接泼冷水:"建先进制程芯片厂非常非常难。台积电干这个干了一辈子。"
; I" R; v( k7 K老黄说的是实话。但 SpaceX 造火箭的时候,波音也这么说过。特斯拉 2026 年资本支出 200 亿美元,马斯克的态度很明确:- `1 X; o$ A2 E, I1 b) x) t! N
"我们的目标是让 AI5 芯片过量供应。如果芯片太多,放到数据中心里就行。"
5 R0 ]: R: k6 `四、Dojo之死/ A& G% b' P- r( v, I4 b4 E
QP0PCP1UfqJEpeC8.jpg
2 u9 T2 k/ K! }; ]1 ]  _- S" W  Z特斯拉的数据中心原本有自己的芯片。故事要从 2016 年说起。& r) j& V, I' D# C! g
那年,传奇芯片架构师 Jim Keller 加入特斯拉。他的履历写满行业里程碑:AMD K8、Apple A4/A5、AMD Zen。他说服马斯克自己造芯片,别再依赖英伟达和 Mobileye。马斯克给了他一个任务:18 个月,造出车载自动驾驶芯片。% z# F" r3 T( T0 h: D0 Q3 W4 W
Keller 带来了老搭档 Pete Bannon,两人在 Apple 一起做过 A4 到 A9。Bannon 1984 年就开始造芯片了。
4 L$ U1 k0 q% U18 个月后,HW3 问世。任务完成,Keller 离开了。Bannon 留了下来,接手了一个更大的项目:Dojo。0 E  T# F5 A0 Q; b* E% C
2019 年马斯克第一次公开提这个名字——一台超强的训练计算机,专门处理车队收集的海量视频。核心是自研芯片 D1,台积电 7nm,500 亿晶体管。架构激进到什么程度?砍掉了虚拟内存和缓存一致性协议。7 e/ w( @- |; x
25 颗 D1 封装成一块训练模块,3000 颗组成 ExaPOD,算力 1.1 ExaFLOPS。超级计算机级别。
. L: I* Z0 ^1 ^" H' N9 `2021 年 AI Day,特斯拉展示了第一块完成的训练模块,当场跑了一个神经网络。台下掌声雷动。马斯克说:"明年应该能投入运营。"
8 j  K4 s8 O$ b/ I" w5 S"明年"没有来。Dojo 在架构层面激进,但工程复杂度被明显低估。
$ I7 R( E0 d7 u! u# \/ ID1 没有外接内存,早期利用率只有 4%——芯片大部分时间在等数据。2022 年在圣何塞测试,功耗刚过 2 兆瓦,变电站跳闸了。据说市政府都打来了电话。
- Q! p  B+ t" V# F  |6 ]6 h2024 年马斯克态度变了,说 Dojo 是"值得尝试的豪赌,但不是高概率成功的事"。同年特斯拉部署了 50000 块英伟达 H100,全面转向。% k5 w* u1 u/ j3 i- D2 Q
2025 年 7 月财报会还在聊 Dojo 2。两周后,彭博社报道项目关停。Bannon 离职,带走了约 20 名核心工程师,创办了一家叫 DensityAI 的公司。客户可能是特斯拉的对手。8 W! ?0 z$ ?& g* Q* b
8 月马斯克正式确认关停 Dojo 2 项目:
- o( ]0 L$ Z( M+ ^% K9 W8 n"一旦所有路径都收敛到 AI6,Dojo 2 就成了进化死胡同。同时开发两套不同的芯片架构没有意义。"
# i  L4 `/ W; T' QDojo 是专用训练芯片,AI5 是专用推理芯片。一个给数据中心训练模型,一个给车跑模型。但 AI6 变了:同样的架构既能推理,也能训练。0 O$ l7 V- z/ o& i! Q+ z
“既然一颗芯片能干两件事,为什么还要维护两条产品线?”
  n$ E% n7 Q# B# g2 d马斯克的新思路是:把多颗 AI6 放在一块板上组成集群,直接替代 Dojo 做训练。他说这套东西可以叫 Dojo 3。2 ]; J9 t7 `$ {' a1 ]. d
多出来的 AI5 怎么办?特斯拉计划在数据中心部署 20,000 台,配合 2,000 块英伟达 H100。英伟达干重活,AI5 跑推理。过量供应的芯片不会浪费——至少马斯克是这么想的。1 Y% b8 a9 E* Q6 W
五、最后一代
1 ^) m  S$ o  j* o2 R. c cBJqJj9OjJL8FERf.jpg " q) }4 a$ [# V. O: |
马斯克把 AI5 定义为“生死存亡”的问题。一个车载计算平台,至于吗?
& _- B( B3 K- U$ S至于。因为 AI5 要支撑的不只是车,还有 Robotaxi 和 Optimus。
! x' p8 q2 a+ d$ a" N; _/ Y这两个业务看起来不一样,一个是无人出租车,一个是人形机器人。但都是摄像头看世界、神经网络理解环境、实时决策——同一套算力需求。: h$ s4 L4 b" o& I7 s4 q" a
2026 年 1 月,奥斯汀的 Robotaxi 开始真正无人驾驶,副驾不再坐安全员。规模很小,约 32 辆 Model Y,限定在地理围栏内。真正激进的是 Cybercab:没有方向盘,没有踏板,压根没打算让人开。2026 年 6 月计划投产。$ k9 I; F' n; Q& }; c) K4 P
Optimus 也在加速。2025 年 12 月,人形机器人户外慢跑的视频刷屏。一个月后马斯克宣布停产 Model S 和 Model X,腾出产线造机器人。他说:"是时候给 S 和 X 一个光荣退役了。"
" Y, ]: @" y; O) \) _' w9 e2 J卖了十几年的经典车型停产,给机器人让路。这个决定放在任何其他车企都是疯了,但特斯拉不是普通车企。Optimus 产能目标:2025 年 1 万台,2026 年 5 万台,最终年产百万台,单台成本压到 2 万美元左右。
! i5 E3 A5 l, B- Y* w) uAI5 要同时供应这两条产品线。但从 AI6 开始,设计重心变了。
2 q  t! e6 S/ d  r6 L: @' i8 a% U马斯克说得很明确:"AI6 是为 Optimus 和数据中心设计的。"车还会用 AI6,但不再是设计的出发点。. ~: G4 B9 o' J& N# Q
AI5 是特斯拉最后一代专门为汽车设计的计算平台。从 AI6 开始,汽车变成了机器人芯片的「副产品」。这句话放在五年前没人会信,但现在看起来是认真的。2 r, F- ]' R2 o6 o2 M$ |
再往后是 AI7。马斯克给了三个字:太空 AI。和 Starship 整合,在轨道上跑计算。" `7 D* \, J5 b; b7 t. s8 u9 T% K
从 HW3 到 AI5,特斯拉的芯片是围着车转的。从 AI6 开始,车不再是主角。2 }1 ~7 O+ S" l+ c" h: {5 c
六、尾声
/ F4 [+ o- T" a% x: N距离 2027 年 AI5 进入大规模量产只剩下一年时间,但这颗芯片的最终设计方案仍未完全定稿。
. ^! p# Y" }9 E& _) Y功耗是摆在最前面的问题。马斯克早期给出的预期是 700 – 800 瓦,随后又下调到约 250 瓦。即便按照后者计算,功耗仍比 HW4 高出约 50%。无论是用于整车,还是部署在 Optimus 上,这个能耗水平都太高了。, F# k) o, x7 L1 h) e% K+ a
双代工策略进一步放大了工程复杂度。三星与台积电采用不同制程生产 AI5,硬件差异不可避免,而软件却必须保持完全一致。这类跨工艺一致性验证,是半导体工程中成本最高、风险也最大的环节之一。3 ^8 q- F) P2 T9 u4 J6 r
资本压力同样清晰可见。165 亿美元的代工合同、TeraFab 建设投入以及约 200 亿美元的年度资本支出,均需由特斯拉独立承担。芯片制造是重资产生意,产线一旦落地,即便低负荷运转,也会持续消耗现金流。
0 x' i8 x* k/ ^- O' h1 P2 P真正的不确定性,仍在需求端。马斯克曾在 2019 年预测 2020 年将有 100 万辆 Robotaxi 上路,但六年后实际规模仍停留在几十辆。Optimus 方面,他在 2025 年提出 2026 年年产 5 万至 10 万台的目标,而目前的部署规模可能仍只有数百台。) W" A0 x9 ^3 K( ~3 z4 u
芯片可以被造出来,但 Robotaxi 和 Optimus 能否按预期放量,仍有待验证。一旦规模未能兑现,“过量供应”就会转化为库存与折旧,数百亿美元级别的产能也将随之沉淀。1 }/ P  _1 w, R* U) m
特斯拉已将 FSD、Robotaxi、人形机器人及部分数据中心需求,集中压在同一套计算平台之上。几百亿美元,一个平台,没有备用方案。
5 d* H" T5 v0 G, [AI5 的成败,最终不取决于参数高低,而取决于规模是否真正到来。2 {9 j. T% u! E' e# D/ Y( v
马斯克说这是存亡问题。他可能是对的。& C. m7 {- d& Z% K* G- V8 _( M! T
                                                                                                                                                                                                                                                                                                                                                                                                                   
集群智慧云科服专利申请服务
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表