设为首页
收藏本站
用户名
Email
自动登录
找回密码
密码
登录
立即注册
快捷导航
云科服社区
BBS
期刊发表辅导
中国专利
国际专利
硕博毕业论文辅导
期刊目录
云硕博
个人提升
手机版
SCI/SSCI/EI发表辅导
闭源SCI/SSCI发表辅导
知网普刊发表辅导
Scopus期刊发表辅导
CSCD期刊发表辅导
万方普刊发表辅导
维普普刊发表辅导
北核期刊发表辅导
南核期刊发表辅导
AMI期刊发表辅导
知网加急发表
中文普刊加急发表
万方期刊加急发表
发明专利
实用新型专利
软件著作权
外观设计专利
版权登记
香港专利
美国专利
日本专利
德国专利
尼日利亚专利
卢森堡专利
MBA/EMBA毕业论文辅导
MPA毕业论文辅导
数学专业毕业论文辅导
计算机专业毕业论文辅导
美术专业毕业论文辅导
人工智能方向毕业论文辅导
土木方向毕业论文辅导
医学方向毕业论文辅导
金融方向毕业论文辅导
教育方向毕业论文辅导
传播学方向毕业论文辅导
工业设计方向毕业论文辅导
北核期刊目录
科核期刊目录
SCI期刊目录
SCI/SSCI期刊检索
中文普刊目录
国际在职硕士
国际在职博士
国内申博论文发表
申博外语能力证明
MUET马来西亚留学
CISA国际信息系统审计师
PMP项目管理师
搜索
搜索
热搜:
SCI发表
论文辅导
1v1学术辅导
在职国际硕士
免考国际硕士
专利申请
尼日利亚专利
发明专利包过申请
发明专利预审
医学SCI发表
本版
帖子
云科服论坛
»
云科服社区
›
学术其他
›
学术工具
›
10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战 ...
返回列表
发新帖
查看:
482
|
回复:
0
10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战
[复制链接]
集群智慧张老师
集群智慧张老师
当前离线
积分
12921
4077
主题
535
回帖
1万
积分
论坛元老
论坛元老, 积分 12921, 距离下一级还需 9987078 积分
论坛元老, 积分 12921, 距离下一级还需 9987078 积分
积分
12921
发消息
发表于 2026-2-15 22:36:30
|
显示全部楼层
|
阅读模式
: C' g; S6 ^; ~8 }. g
出品 |《态度》栏目
作者 | 袁宁
( J7 F. m+ I/ ]( Y6 v- J) B" A
编辑 | 丁广胜
( D/ l, ^* C2 M) T
7 b( y \1 w% u* P; s
2月11日深夜到12日清晨,短短几个小时内,中国三家知名的大模型公司几乎同时完成了一轮关键更新:
3 H+ s9 c* ^/ Z q v
' g& t$ X0 t. y: o, H% n* G
智谱正式发布 GLM-5,MiniMax M2.5在产品中悄然上线体验,DeepSeek 也启动新一轮能力升级。
# L- `" I8 x9 G* c
智谱 GLM-5:从“写代码”到“搞工程”
; S2 F0 \5 t( Y* o
2月12日,智谱正式官宣上线并开源新模型 GLM-5。同时确认:此前在 OpenRouter 上爆火的匿名模型
Pony Alpha
,正是 GLM-5。
3 ] K1 n7 T2 F) d$ ^* w; ^9 y
在匿名测试阶段,这个模型已经被全球开发者当作真实生产工具使用。有人用它做横版解谜游戏,有人搭建 Agent 交互世界,也有人直接基于它开发出
论文
版“抖音”等完整应用形态。模型在没有品牌背书的情况下完成真实市场验证,本身已经说明了能力层级的变化。
! {# A R x* G' D1 X& a
: u6 x7 C. z( E0 ?" `3 y- [+ u7 w( j+ ]+ v
智谱对 GLM-5的定位非常明确:它不是一个聊天模型,而是一个
Agentic Engineering
基座模型
。
1 V2 ~/ }4 H" v6 X
过去两年,大模型的主流叙事是“写代码”“写前端”;而现在,行业共识正在转向:模型需要完成完整工程与复杂任务,即从「Vibe Coding」走向「Agentic Engineering」。GLM-5正是这一阶段的代表产物。
+ D L. @& {: b6 Z/ z3 ?" w
5 j2 l. U" e6 {9 n
与上一代相比,GLM-5不再满足于生成一个漂亮 demo 或一段 Python 脚本,而是为稳定交付生产级结果而生。在真实编程场景的使用体感上,GLM-5已经被认为逼近当前行业天花板 Claude Opus 4.5。
* @9 e$ [+ p. h
在底层能力上,GLM-5进行了全面扩展:
% q" N* `: q6 O8 o! _
● 参数规模: 从上一代的355B(激活32B)扩展至744B(激活40B)。
+ V4 J3 u2 E8 I7 M' s3 _
● 数据量级: 预训练数据从23T 提升至28.5T。
8 Q. S# o7 T8 A' @( F
● 架构创新: 首次集成了 DeepSeek Sparse Attention 机制。这一技术在维持长文本效果无损的同时,大幅降低了模型部署成本,提升了 Token 的生成效率。
! M. v: ] J+ H) a# d
● 异步强化学习: 构建了全新的“Slime”框架,让模型能够在长程交互中持续学习,不再是“聊几句就忘”。
% B" S4 V( g+ Q5 F+ _" U
4 X9 k* f) K9 ~; Q7 n/ W1 q# d9 e! a
在全球权威的 Artificial Analysis 榜单中,GLM-5位居全球第四、开源第一。
2 v8 k6 d: l3 H" F5 z
) q. F5 s6 h8 G; S" z
GLM-5在编程能力上实现了对 Claude Opus 4.5的对齐,在工程师最看重的 SWE-bench-Verified(软件工程基准测试)中,GLM-5拿下了77.8的高分;在 Terminal Bench 2.0(终端操作能力)中达到了56.2。这两个分数不仅是开源模型的 SOTA(State Of The Art),更直接超越了 Google 的 Gemini 3 Pro。
8 Q9 h7 [9 l7 M2 ? R
在智谱内部的 Claude Code 评估集合中,GLM-5在后端重构和深度调试等“硬骨头”任务上,比 GLM-4.7平均提升了超过20%。
9 q$ v: n* {! E
* Q4 H/ O- @! X4 E
GLM-5在 Agent 能力上实现开源 SOTA,在多个评测基准中取得开源第一。
" s3 |8 w# X* {2 v( D
% g0 o) _) j5 B; v0 T
更有意思的是 Vending Bench 2的测试结果。这个测试要求模型在一年期内经营一个模拟的自动售货机业务。GLM-5最终的账户余额达到了4432美元。这意味着它不仅会写代码,还懂得资源管理和长期规划,这种“经营能力”是迈向 AGI 的关键一步。
) y' u- r' Z# b+ v i1 ~1 R+ S
( @0 ~5 a' X* O* `! K! d: O6 w
同一夜:MiniMax 与 DeepSeek
$ z- s" x( |' J# J
就在智谱官宣的同时,另外两家巨头的布局也在进行。
7 n+ I# J& b1 z3 K6 y) E- l; p% d
昨晚,细心的用户发现,在 MiniMax Agent 产品中,底层模型选项里悄然出现了一个新名字——
MiniMax M2.5
。
0 K( ]% b3 W7 G: s) `8 _8 o
0 ]3 o! D" k% g& V* [
虽然公司尚未正式官宣,但这显然是一次在产品端的“实弹演习”。据早期测试用户反馈,“M2.5 Agent能力炸裂”,“编程和工具调用又强又便宜”。
* \& h5 |6 I5 r j. N
8 p# ^: R3 S. B4 v( ?
据我们了解,MiniMax M2.5定位为全球首个为Agent场景原生设计的生产级模型。其编程与智能体性能 (Coding & Agentic)比肩国际顶尖模型,直接对标 Claude Opus 4.6,支持PC、App、跨端应用的全栈编程开发,尤其在 Excel高阶处理、深度调研、PPT等Office核心生产力场景中处于SOTA地位。
3 d2 n* X6 ]: G2 Q! r$ b+ E* h
同时,M2.5模型激活参数量仅 10B,在显存占用和推理能效比上优势明显,支持 100 TPS 超高吞吐量。
% g4 a$ a* L: R+ o9 F
此外,就在众人还在猜测
DeepSeek V4
何时到来时,DeepSeek也在悄然更新。
3 l5 m' | @; l, `' r# |
我们在昨晚尝试询问 DeepSeek 的最新状态,在关闭“深度思考”和“联网搜索”后查询模型信息时发现,其上下文长度已提升至1M Token(此前为128K),知识库截止日期更新至2025年5月。
6 i( c1 ^3 \/ x1 O1 |# R/ f
9 g2 L- \+ a3 U7 c) t" K
2026年,注定不会平静。
9 f9 S# b" a( G. [
智谱用 GLM-5证明了中国模型在复杂工程能力上已能与世界最强掰手腕;MiniMax 在产品端极速狂奔,抢占用户心智;而所有人依旧在等待 DeepSeek 出招。
: l1 K, T7 z q# M+ m
+ v( s: t* O' T: X3 x2 K0 d' x
对于此时此刻的身处浪潮中的我们来说,唯一的选择就是——跟上速度。毕竟,在这个10倍速的夜晚过后,掉队可能只是一瞬间的事。
. J+ U+ J9 |8 n. e4 `
5 v7 G5 u: V& U& \7 ?6 s2 |0 k
回复
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
留学生活
外观设计专利
休闲灌水
学校论坛
基金课题
CSCD/AMI期刊
导师招生
EI会议/知网会议
公司地址:大连市高新园区黄浦路科技创业大厦19层 运营中心:大连市沙河口区金盾路127号 研发中心:大连市西岗区大工西岗科创产业园10层 邮政编码:116029
全国客户服务热线:4006-054-001 微信咨询:543646 业务咨询、合作:159-9855-7370(同微信) / 173-0411-9111 电子邮件:Djy@Jiqunzhihui.com
集群智慧®为我公司注册商标,受法律保护,侵权必究。侵权删除:2544906@QQ.com
本企业已通过ISO9001国际质量管理体系认证、ISO45001职业健康安全管理体系认证、ISO14001环境管理体系认证、企业信用等级AAA级认证、科技型中小企业认证、高新技术企业认证。
本站部分服务由本平台认可的第三方服务机构提供,如服务的质量有任何问题,请第一时间向我平台反馈,我们将及时为您解决,平台保障用户的全部权益不受任何损害。
本站所涉及的期刊咨询、指导服务,服务包括选刊指导、投稿指导、学术指导、翻译润色等,均通过全流程的高标准服务对结果负责,坚决杜绝代写等学术不端行为。
请认准本站网址(www.jiqunzhihui.org.cn),推荐百度搜索“集群智慧云科服”直达本站。D-U-N-S邓白氏全球编码:620550735 增值电信业务经营许可ICP/EDI证:辽B2-20230179
版权所有:大连集群智慧科技服务有限公司 ICP备案:
辽ICP备2021010330号-3
公安备案号:辽公网安备21020302000612号
手机版
快速回复
返回顶部
返回列表