2月13日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T。据介绍,该模型在长文本生成、数学推理与智能体任务执行等方面达到开源领先水平,旨在为智能体时代的复杂任务处理提供基础支撑。
7 w1 b* x- ]# m: ^3 s, S0 N1 O
, o/ y* `# n" ~
+ \5 `4 n5 n' o3 a图注:Ring-2.5-1T在数学、代码、逻辑等高难推理任务和智能体搜索、软件工程、工具调用等长程任务执行上均达到开源领先水平 $ Z0 |! a2 A7 C. O9 r% c: h
据悉,Ring-2.5-1T基于Ling 2.5架构研发,通过优化注意力机制,提升了长文本推理的效率与稳定性。在生成效率方面,该模型在32K以上长文本生成场景中,对比上代模型访存规模显著降低,生成吞吐提升约3倍。模型激活参数规模从前代的51B提升至63B,但在混合线性注意力架构的支持下,推理效率相比上一代仍有大幅提升,有效缓解了长输出场景下计算开销高、推理速度慢的问题。
! u3 U3 a d& m
5 P7 w0 o, u& D0 U/ z5 ?6 W) f
- Q( |) f% K/ U5 k$ w图注:在不同生成长度下的效率对比示意。生成长度越长,吞吐优势越明显
4 ~0 O4 h' w- b2 l Y. n6 Z. }: ~# E在深度思考能力方面,据了解,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,该模型可适配Claude Code等智能体框架与openclaw个人AI助理,支持多步规划与工具调用。
" Y: R" ~ L7 z8 B% \/ G% ?相关基准测试显示,Ring-2.5-1T与DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking等主流模型进行了对比。在深度思考模式下,该模型在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中表现良好,展现了复杂推理与跨任务泛化能力。
) m4 F2 E4 U: n) m8 K/ B目前,Ring-2.5-1T的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务预计将在近期上线。(袁宁): g( d2 u/ Q. B! p/ J
|