找回密码
 立即注册
查看: 271|回复: 2

DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

[复制链接]

1975

主题

290

回帖

5700

积分

论坛元老

积分
5700
发表于 前天 22:36 | 显示全部楼层 |阅读模式
快科技2月11日消息,这个春节全网都在等DeepSeek发布最新的大模型DeepSeek V4,但是现在来看大版本不一定会在春节期间发布,今天DeepSeek悄然更新了新版本,亮点不少。
' p" |: c  V( x% d; W( t. H根据DeepSeek自己的介绍,这次更新主要是提升了上下文能力,达到了1M,而之前的DeepSee V3系列也就是128K。( X8 O4 z7 O  C  ?/ M* M& F7 i
有了1M上下文,DeepSeek可以一次性处理《三体》三部曲这样体量的超长文本,这点已经得到了很多网友的实测证实。
0 ~# m- R6 e' X% c* Q2 A tXYE1X1Lw1y8WY14.jpg 9 K/ J3 H. c3 F
其他方面的能力是之前就有的,DeepSeek也没有提及更详细的信息。
3 |  U3 l$ `  A2 T& R值得注意的是,DeepSeek在回答完这个问题之后还特别加了一段,强调它就是最新的DeepSeek模型,没有特定的子名称,不是V3也不是R1,彷佛在刻意强调这个模型的不同,但又不让人产生这就是V4 Preview预览版的联想。
$ H+ L' q/ b8 @7 \ n2PE6H2PlevwPy8U.jpg
. Z7 S  t6 n/ C- a但是从网友的反馈来看,这次DeepSeek的小更新实际上能力提升很大,知名大模型测试博主@karminski-牙医已经发布了一个快速测试,主要测试了编程方面的一个大象牙膏的测试项目。
  ?& t. \- j+ [5 h" p' d0 {结论就是肉眼可见美学, 建模, 物理模拟, 代码性能都有提升, 甚至还有小惊喜,这个就是比之前发布的任何版本都SOTA,也就是当前最优的大模型(当然主要是指DS的版本)。
4 Y% C1 _) K8 P- V9 i) J2 S目前还不确定DeepSeek的这个新模型是不是完全体,因为有网友测试这两天很热门的50米距离上去洗车是走路还是开车去的问题上,DeepSeek新模型给出的回答不一,有人说正确,有人说不行。
4 F/ p1 E/ G" _0 p# U- C/ o! v2 Q yHhpiPZMZVHXOWxP.jpg
集群智慧云科服专利申请服务

30

主题

230

回帖

790

积分

等待验证会员

积分
790
发表于 前天 23:06 | 显示全部楼层
中国的大模型发展越来越快,从V3到这次更新,性能提升明显,未来可期
集群智慧云科服SCI/SSCI/EI期刊发表服务

0

主题

1303

回帖

3945

积分

论坛元老

积分
3945
发表于 前天 23:36 | 显示全部楼层
说再多有什么卵用?编程不还得用26字母?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表