找回密码
 立即注册
查看: 968|回复: 4

DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集 ...

[复制链接]

1828

主题

290

回帖

5700

积分

论坛元老

积分
5700
发表于 昨天 16:46 | 显示全部楼层 |阅读模式
  在东方财富看资讯行情,选东方财富证券一站式开户交易- y% e) A8 F+ i+ D& D$ S+ }9 i
                                                              DeepSeek传闻中的V4尚未正式发布。2月11日,多位用户反馈DeepSeek已在网页及App端进行版本更新,上下文窗口由原有的128K直接提升至1M(百万Token)级别。7 l4 t3 @, A3 F' N6 f. r
  《科创板日报》记者实测中发现,DeepSeek在问答中称自身支持上下文1M,可以一次性处理超长文本。此外,版本模型知识库截止时间更新至2025年5月。不过,新版本目前不支持视觉输入,也不具备多模态识别能力。/ c. Q( w( `9 d" [: k& D# R
  《科创板日报》记者进一步询问模型的版本,DeepSeek称没有固定的版本号,更像一个持续进化的"最新版
' R/ }1 S+ O. [8 @( W  在尝试提交了超过24万个token的《简爱》小说文档后,DeepSeek可以支持识别文档内容。: q$ E* Z" d$ ]( q2 }" c% P
  三体三部曲合计总计90万字,这也意味着DeepSeek能够单次完成处理《三体》全集的长文本。+ T" g. z# H2 w2 F0 [1 @8 }+ y* ~
  记者随即提交了《三体》全集,DeepSeek的处理速度相较文字更少的《简爱》要慢一些,但也在几分钟内完成了文档阅读。8 t6 q, j( n. {2 F# S6 R9 g6 e
  值得关注的是,近期DeepSeek开放了多个技术岗位招聘,包括产品经理/模型策略产品经理、客户端/前端/全栈研发工程师等。6 b8 K- ~- [' M$ _3 m1 Q4 e# r! m; D# \
  此外,DeepSeek还在1月14日发布了CFO的岗位招聘。
6 G  w, N7 D3 l' G0 @. @  目前,能将上下文推至百万级别的模型较少,谷歌的Gemini系列和Anthropic的Claude Opus 4.6等已率先实现。
+ w$ c8 L+ z9 F. N$ r4 ^  DeepSeek的V系列模型定位为追求极致综合性能的基础模型。2024年12月推出的基础模型V3是DeepSeek的重要里程碑,其高效的MoE架构确立了强大的综合性能基础。此后,DeepSeek在V3基础上快速迭代,发布了强化推理与Agent(智能体)能力的V3.1,并于2025年12月推出了最新正式版V3.2。同时,还推出了一个专注于攻克高难度数学和学术问题的特殊版本V3.2-Speciale。
* P3 T5 a! g' V. ^1 Y  科技媒体The Information此前爆料称,DeepSeek将在今年2月中旬农历新年期间推出新一代旗舰AI模型DeepSeek V4,将具备更强的写代码能力。  d: s% g2 `$ Y: Z. F( e
  随着这个日期迫近,襁褓中的V4成了关注焦点,Deepseek的每一次更新,都引来诸多关注。据《科创板日报》梳理,今日的版本更新之外,年初以来,Deepseek公布了两项底层架构突破,并释放一个旗舰迭代信号。* X: W' E9 I  f0 D& E
  今年初,DeepSeek团队发表两篇论文,公开了两项创新架构:mHC(流形约束超连接)用来优化深层Transformer信息流动,使模型训练更稳定、易扩展,在不增加算力负担前提下提升性能;Engram(条件记忆模块)将静态知识与动态计算解耦,用廉价DRAM存储实体知识,释放昂贵HBM专注推理,显著降低长上下文推理成本。' {4 J* V' c6 B" `$ a2 ?* l
  这两项技术被认为是中国大模型突破“算力芯片和内存瓶颈”的算法创新,创始人梁文锋均署名参与相关论文。
9 M, T! ~  A! y! [+ U& G6 `7 a5 p" F  1月21日,R1模型发布一周年之际,DeepSeek新模型“MODEL1”曝光。DeepSeek官方GitHub仓库更新了一系列FlashMLA代码,借助AI对全部总代码文件数:114个(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)进行分析,发现了一个此前未公开的模型架构标识“MODEL1”,共被提及31次。" w4 M( T# N& V% U

4 D1 H3 m: q5 ^2 `+ c  w) a" u* Q" e1 g5 Y1 O7 h! m4 ?# {# [# U
2 @  r1 \2 R; k+ a: ]0 r
  想炒股,先开户!选东方财富证券,行情交易一个APP搞定>>! U( v% K. Z! M( \6 y# m& o6 V
(文章来源:科创板日报)
集群智慧云科服专利申请服务

0

主题

1187

回帖

3597

积分

论坛元老

积分
3597
发表于 昨天 17:01 | 显示全部楼层
应该会有更大的亮点
集群智慧云科服SCI/SSCI/EI期刊发表服务

0

主题

1187

回帖

3597

积分

论坛元老

积分
3597
发表于 昨天 17:16 | 显示全部楼层
滚滚滚滚滚滚滚滚滚滚滚滚滚!

0

主题

1187

回帖

3597

积分

论坛元老

积分
3597
发表于 昨天 17:30 | 显示全部楼层
滚的吸血鬼

0

主题

1187

回帖

3597

积分

论坛元老

积分
3597
发表于 昨天 17:46 | 显示全部楼层
DeepSeek概念,年前最后两天,来一波
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表