找回密码
 立即注册
查看: 268|回复: 2

DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

[复制链接]

1850

主题

290

回帖

5700

积分

论坛元老

积分
5700
发表于 昨天 22:36 | 显示全部楼层 |阅读模式
快科技2月11日消息,这个春节全网都在等DeepSeek发布最新的大模型DeepSeek V4,但是现在来看大版本不一定会在春节期间发布,今天DeepSeek悄然更新了新版本,亮点不少。# f1 y( k2 ^! s" d
根据DeepSeek自己的介绍,这次更新主要是提升了上下文能力,达到了1M,而之前的DeepSee V3系列也就是128K。
7 ~% x* L0 k; [) ]0 ~2 ^7 l1 C+ y8 ~有了1M上下文,DeepSeek可以一次性处理《三体》三部曲这样体量的超长文本,这点已经得到了很多网友的实测证实。
5 |) }0 T4 `& r$ I tXYE1X1Lw1y8WY14.jpg
) q7 X( J2 {0 I  T6 b其他方面的能力是之前就有的,DeepSeek也没有提及更详细的信息。& j, r$ v5 g7 M$ [7 w  p' L0 e
值得注意的是,DeepSeek在回答完这个问题之后还特别加了一段,强调它就是最新的DeepSeek模型,没有特定的子名称,不是V3也不是R1,彷佛在刻意强调这个模型的不同,但又不让人产生这就是V4 Preview预览版的联想。( s3 R6 o: `' |1 \
n2PE6H2PlevwPy8U.jpg
& K+ u/ \- q% t+ ]3 M但是从网友的反馈来看,这次DeepSeek的小更新实际上能力提升很大,知名大模型测试博主@karminski-牙医已经发布了一个快速测试,主要测试了编程方面的一个大象牙膏的测试项目。/ N3 r5 I* s' ^! {
结论就是肉眼可见美学, 建模, 物理模拟, 代码性能都有提升, 甚至还有小惊喜,这个就是比之前发布的任何版本都SOTA,也就是当前最优的大模型(当然主要是指DS的版本)。
, |! x2 T& @, f/ Q9 v" Q目前还不确定DeepSeek的这个新模型是不是完全体,因为有网友测试这两天很热门的50米距离上去洗车是走路还是开车去的问题上,DeepSeek新模型给出的回答不一,有人说正确,有人说不行。0 N) o* x0 N* J; A+ b" _$ k
yHhpiPZMZVHXOWxP.jpg
集群智慧云科服专利申请服务

30

主题

230

回帖

790

积分

等待验证会员

积分
790
发表于 昨天 23:06 | 显示全部楼层
中国的大模型发展越来越快,从V3到这次更新,性能提升明显,未来可期
集群智慧云科服SCI/SSCI/EI期刊发表服务

0

主题

1192

回帖

3612

积分

论坛元老

积分
3612
发表于 昨天 23:36 | 显示全部楼层
说再多有什么卵用?编程不还得用26字母?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表