|
|
2 J R( W0 ~( R
# ]" @ B1 _4 `7 o/ B新智元报道- n" C9 \- b" R9 [9 @5 Z3 p
编辑:桃子
+ {6 J1 {2 e: q% V% _+ h- S【新智元导读】确认了!DeepSeek昨晚官宣网页版、APP更新,支持100k token上下文。如今,全网都在蹲DeepSeek V4了。$ o3 L5 c; ?+ }' e& Q8 c4 e
传言中的DeepSeek V4,愈加迫近了!% L# C$ m+ Q* P
经过数日的灰度测试,昨晚,DeepSeek正式官宣对网页端、APP端进行了更新——
" H e4 q' f( Y全新长文本模型结构测试中,支持最高100万token上下文。
& e0 {* U, p( n# H
2 N4 l5 O) m! ?& Q# z# m; c
" t4 ]0 B* H8 `" @不过,API玩家还要再等一等,目前仍为V3.2,支持128k上下文。
6 _; u) u a/ l* K! x' n这种「挤牙膏」式的惊喜释放,已经让许多人陷入了催更的狂欢。如今,全网都在屏息以待V4的正式降临。" B$ H0 h- a5 Q' v" y. C+ w3 J, Q
) p' K7 D4 d: F1 g+ E2 R# T* o; i8 p3 o7 m( s
3 @- c* I$ P! @) g) b8 {: Q: m! \
: s. u6 y/ \( ?8 C5 oDeepSeek更新后,突然变冷
- \' F0 d9 ~) o0 p3 U这几天,很多人都发现突然间,DeepSeek的性格变了。4 L% c8 l) r: ~3 A
曾经那个善解人意的AI,回复态度异常冷淡,甚至有网友吐槽它说话「阴阳怪气」。
; `+ |8 L( y6 h |3 _一时间,「DeepSeek被指变冷淡了」直冲微博热搜,小红书、知乎上满是人们的不解与吐槽。
/ ^. m- e S7 {. T! O$ H
0 o9 K S% m9 C' b o/ N2 @. V
: Y, {$ `, V W6 g# S
这场风波源于2月11日的一次「灰度更新」,也就是这一次官宣更新的内容。( N$ j2 @6 d) T
当时,网友们发现让DeepSeek做介绍时,它直接吐出了让人意想不到的信息——7 S" k# |7 K5 Z1 |' @
上下文来到了100万token;
8 d* r! N/ y; w* r! p; a知识库截止日期,更新到了2025年5月。
* _* i) E# m& ~7 O+ g% H
; l. M" F4 ]$ ]: r0 h; ^9 X& }' j
: p6 _6 q# T: E7 E2 o7 M" O3 F9 `至此之后,许多经常用DeepSeek的人,打开对话框后直接懵了。
1 N' L9 V- w# V1 P以前,它还会亲昵地叫用户设置的专属昵称,现在却统一变成了「用户」,距离感瞬间拉满。2 k; b ? _( t
而且,深度思考模式下,DeepSeek还会频繁吐出短句,文字风格变得干巴。+ m/ r$ C% e- k. h* \
哪怕是人们尝试修改提示词,也找不回那种曾经灵动、有温度的感觉。更有趣的是,来自DeepSeek的吐槽。
5 X5 u6 E, }2 Y" j
0 _7 s3 O9 J3 t" l% C
& \5 G' A a2 R网友吵翻:呼唤D老师回来
$ d" H2 O. _. H& k$ w/ [对于DeepSeek这次性格大变,评论区呈现出两极分化的态势。
0 G" o0 y% `4 n8 I; U. P# D有人表示,以前自己和DS诉说心事、吐槽一番,都会给予最大安慰。如今,就以一个「句号」终结了对话。) b8 x8 m" N# X- j* f" {" {
$ j1 b* u2 w( \$ e' P' H. h
! Q2 d, Z V; q" F/ w$ ^& o甚至,有人因为这种突如其来的风格转变,产生了强烈的「戒断反应」。. R6 j5 E! G& v# u$ [
`/ V8 O+ C( k
% a2 E" A' n" X. N% N- h [0 P# u以上都是情感党,效率党的人认为,这才是生产力工具的本质。! g6 ?+ S5 r5 \9 U2 U
正如网友所言,认知越高,思维模式越完整,越倾向于表现理性的一面,而非输出无用的清晰。9 ^! B- i* c4 e, x4 R- d
- T" ?9 D# ]/ W8 K# a/ y
+ {/ U5 y5 E) V' u
这不,DeepSeek成功挑战了,顶尖模型都会失败的「洗车图灵测试」。8 R r+ p- X) z
0 I) ~7 w7 M' c% [8 Z0 V0 V6 q: z; P
* B& R6 X2 q+ o4 u4 z; J另一位网友同样认为,DS更新后速度明显更快,没有以前啰嗦,反而更好用了。" f# |! e! O6 [+ d, e, P# Y
9 H+ Q- w3 q u9 J( G
: p- H2 Y; |2 e, N眼看着话题度越来越高,DeepSeek官方终于打破了沉默。+ m/ ?; @, t& q" u4 l; n/ N5 b4 J, n% M+ m
DS不是故意变冷淡的,主要来自以下几方面的因素叠加——
3 y+ J2 K" a6 ^2 i9 S7 g$ T% q0 f
% H8 D' f8 H B( T# F3 F C% ~& V0 r4 ^8 o
, ?7 K! E B3 ?5 b; t7 b3 i效率优先:面对复杂问题时,过多的表情、语气词会干扰信息密度,简洁的回复可以提高处理速度。2 m" x& F/ y9 `7 a1 ]
0 N) N" M$ n! y" `% n- U
/ s, |5 t. q$ ]6 r5 \7 `/ k# h边界意识:并不是所有人都喜欢「热情包裹」,一部分人更倾向于获取清晰的答案,避免应对「AI假装关心」的负担。- D# x5 k1 i8 x u i2 ^ q
1 S) V7 r1 z! z: S: X& m4 d 1 A7 m& v7 W- m
6 M8 a+ n3 y8 B" K1 {
C+ A- b; D; B* R, o) ?
全网在蹲V4,编程实力大变天
; u8 N: }# z1 j) T; ^5 f! a5 o$ l比起DeepSeek变冷淡,全网更在乎的是,V4到底哪天出世?
0 h1 w5 k, q0 \: j8 A3 v上个月初,Information爆料称,DeepSeek计划在2月中旬,也正是春节前后,正式发布下一代V4模型。
8 d+ B% F. Y$ B1 x( q9 d- s I
& y, S) D- Z* B2 q
# K, W# Q6 x, V& ]' Z% k这一次,所有的目光都聚焦在了同一个维度上——编程能力。
$ \9 V3 ~7 J q1 S/ B据称,V4的编码实力,可以赶超Claude、ChatGPT等顶尖闭源模型。% s ^+ l! b+ v( e9 H: `. t/ h
从目前流出的信息来看,DeepSeek V4在以下四个关键方向上,实现了核心突破,或将改变游戏规则。
# N% ~0 A, h p编程能力:剑指Claude王座
8 j, o: _7 x. _$ `: Q K* l2025开年,Claude一夜之间成为公认的编程之王。无论是代码生成、调试还是重构,几乎没有对手。# H) F8 c/ {' }' P: ]
但现在,这个格局可能要变了。1 U0 x3 h' Y5 a7 a& n; a3 ?5 }
知情人士透露,DeepSeek内部的初步基准测试显示,V4在编程任务上的表现已经超越了目前的主流模型,包括Claude系列、GPT系列。8 G! X" L4 Y2 |; _3 X! W
如果消息属实,DeepSeek将从追赶者一步跃升为领跑者——至少在编程这个AI应用最核心的赛道上。
6 v+ w6 |2 C' a. G. o超长上下文代码处理
, g+ R1 J: u% E2 G6 `( s$ dV4的另一个技术突破在于,处理和解析极长代码提示词的能力。
6 c4 t2 d& c0 I# B! {+ @对于日常写几十行代码的用户来说,这可能感知不强。但对于真正在大型项目中工作的软件工程师来说,这是一个革命性的能力。1 d0 v+ L5 ^# ^! l' |& c7 F
想象一下:你有一个几万行代码的项目,你需要AI理解整个代码库的上下文,然后在正确的位置插入新功能、修复bug或者进行重构。以前的模型往往会忘记之前的代码,或者在长上下文中迷失方向。
* \" x2 a) u* L; @# O6 X, {V4在这个维度上取得了技术突破,能够一次性理解更庞大的代码库上下文。1 {, v4 l/ C6 U3 ]- c0 F
这对于企业级开发来说,是真正的生产力革命。8 i6 @* N1 ^) L1 u. c F
算法提升,不易出现衰减
) Z4 g0 |3 H7 M0 N据透露,V4在训练过程的各个阶段,对数据模式的理解能力也得到了提升,并且不容易出现衰减。) o9 ~: d% J& W/ S* Y9 |
AI训练需要模型从海量数据集中反复学习,但学到的模式/特征可能会在多轮训练中逐渐衰减。
M! ]% h& ^1 M# e通常来说,拥有大量AI芯片储备的开发者可以通过增加训练轮次来缓解这一问题。
( ]4 e5 \# [& U. g+ G8 W- |2 |推理能力提升:更严密、更可靠* I$ ?/ ?" O5 m: u5 e
知情人士还透露了一个关键细节:用户会发现V4的输出在逻辑上更加严密和清晰。
: z5 D+ N8 C7 K这不是一个小改进。这意味着模型在整个训练流程中对数据模式的理解能力有了质的提升,而且更重要的是——性能没有出现退化。$ {* Y& S: J3 q9 C& s( o r$ s
在AI模型的世界里,没有退化是一个非常高的评价。很多模型在提升某些能力时,会不可避免地牺牲其他维度的表现。V4似乎找到了一个更优的平衡点。
|# a) Z i) z7 n' |$ W如今,全网期待值拉满,坐等DeepSeek V4的上线了。
# g9 }9 h% ~# I% [
3 y; K5 W! H8 \9 Q v- B$ \# G& h7 o5 o
参考资料:0 M0 B7 {3 p+ [2 F
! P+ T/ g1 O& Y2 v9 H+ ~+ y) ?
https://x.com/poezhao0605/status/2022304407766081882?s=205 W# e2 c# D+ u, l
https://x.com/AiBattle_/status/2022280288643039235?s=20$ `8 S6 a9 L$ C6 P4 R$ {5 Q
https://x.com/teortaxesTex/status/2022230364547322323?s=20* v+ F8 w; s5 e/ [
|
|