|
|
如果把人的大脑比作一台计算机,那么北京大学计算机学院杨仝老师的大脑似乎总在运行一个名为科研的程序。无论是日常通勤、饮食休息,还是睡梦中,他都不停思考着科学研究的前沿难题。0 Z$ I6 N) X7 w% C1 w
这种近乎本能的思考状态,来自于他一路走来的科研轨迹。学生时代的杨仝,是许多人眼中的“天才少年”——用三年在清华拿到博士学位,在中国科学院计算所访问一年,之后便来到北大继续科研之路。! o0 x) N; a8 Z& R; Z; a
近年来,杨仝带领团队发表CCF A类论文100多篇,与华为、小米、360、开物等多家企业展开合作,并成立了三个联合实验室,持续推动研究成果转化为解决实际问题的有效工具。在与华为的合作中,已累计6次获得华为“难题揭榜”火花奖。
2 J( I+ v' {2 o8 J作为北大数据结构实验室的负责人,杨仝带领团队在2018年发表北大首篇SIGCOMM顶会论文,2025年提出全球首个复数基座大模型和首个复域变换方法(实数大模型与复数大模型双向等价转换)。数年时间内,多次应用经典数学理论,实现独具理论美感的算法创新与落地,例如费马小定理+Sketch、四色定理+过滤器......( m+ K u2 \( D _
杨仝的科研团队也在不断吸收着一批批优秀同学加入,其中不乏拿国际竞赛金牌的同学。实验室里跳动的代码和公式,搭载大模型灵活移动的机器人,都是这支不断壮大的团队用AI技术贡献社会、服务国计民生的生动印记。# H- z* Y" u! I, S$ o: k* U
北大PKU-DS实验室的学生
5 m1 d) g8 g" X杨仝(左)指导实验室学生调试搭载大模型的机器人 & o: ~8 r6 D9 s& F/ G! v7 L5 I
01 大% _) q" w. E* q0 g- z
道2 k# b' U5 }# z& y
至
, F7 P, l; y" k2 s( O* t简7 ~+ {8 R% G8 q, T
- 给大模型做“减法” -
! X7 u2 G. U' q6 ]6 s近年来,AI大模型迅速发展,但其部署仍面临“成本高、功耗大”的瓶颈。要想降低部署空间与费用,推动大模型在手机、机器人等终端设备上普及应用,发展高效的轻量化方案已成为关键需求。这也正是杨仝团队全力攻克的技术痛点。7 O) L. R3 Z: ^
团队最初在实数轴上反复尝试,微软的方案是0和±1,看似合理,却浪费了25%的空间;换成±1、±2,实验效果又大打折扣。实数轴上想找4个对称、合理又高效的点,根本做不到。4 Y% D1 z+ \4 ~& t! u }6 Y* s0 C" ]
面对难题,杨仝的思索停不下来。在一次开车通勤时,一个灵感在他的脑海中闪过:“横坐标加纵坐标,不就有天然完美的四个点吗?+1、-1、+i、-i,取±1的时候,虚部是0,取±i的时候,实部是0,对称又简洁。矩阵乘法还简化成了实部和虚部的加法,没有比这更理想的组合了!”这个发现让他兴奋不已。! G! ], p' W9 g. W! `
但灵感也只是开始,落地的路上密布荆棘:复数大模型是全新方向,领域内没有任何可借鉴的经验。十月份想到的idea,到来年三月份才拿到算力。开始预训练时,90%以上都以失败告终,高昂的租卡成本也带来巨大的压力,有时团队甚至觉得坚持不下去。计算机学院院长胡振江老师曾鼓励青年学者“要做第一且唯一的研究”。大模型领域“第一且唯一”的方向少之又少,而复数大模型正是这样的创新,这让团队的决心历久弥坚。; D+ }7 y4 a( r8 R2 ^5 F3 H5 a
除此之外,支撑他们熬过反复失败的,是对复数模型的第一性直觉——“模型的数学结构本身很漂亮,而且自然界中大量信号天生就是复数形式,有模长、有辐角,这种贴合自然的设计,没理由做不成。”经过不懈努力,杨仝团队提出的新方案最终落地,推出Fairy系列大模型,用复数将矩阵乘法完全消除,转化为能耗低一个数量级的加法。这种底层技术创新,源于杨仝对数学美感“大道至简”的执着追求。
* H. h' f0 ^8 V2 {, }, U《计算机研究与发展》主编徐志伟老师评述复数模型的论文:妙在展示了团队的数学洞察、理论创新、技术突破。他们继承了从黎曼到彭罗斯的智慧:复数有其独特的奇妙。
0 }: N% j$ J+ G2 m; K. O: B6 A杨仝讲解iFary整体架构 . H/ [* ^' r/ @3 K
打开北京大学APP,“大模型试验场”一栏的FairyR1-32B-Preview模型,就出自杨仝团队之手。Fairy R1模型通过将参数量精简至DeepSeek-R1 671B满血版的5%,实现极致轻量化的同时,保持了极高性能,最终在数学与代码能力上超越DeepSeek-R1满血版。. i' u) A0 N* i
值得一提的是,在FairyR1之外,杨仝团队在“大模型做减法”方向上还有两项代表性工作:iFairy探索复数域原生建模与极限量化下的性能上界,Fairy2i则聚焦已有模型的低成本迁移与高效部署。两条路线从不同方向推进同一件事——让大模型更轻、更省,同时尽可能保持高性能。# d% V. M1 w8 B4 L8 d
这个给大模型做减法的过程,合乎计算机的发展轨迹,从占满几个房间的巨型机,到如今能够被每个人握在手心的手机,设备越来越小,也越来越普及。# i9 A( t P0 W8 M8 \
“大模型必然会走同样的路”,杨仝说,“从云端逐步下沉到企业局域网、笔记本,最终的目标是让大模型装到手机这样的小型终端里,或者按需部署到机器人、机器狗身上。”
" A) b ]6 `' L更珍贵的是,杨仝团队将iFairy和Fairy2i代码、数据和模型全部开源,让更多人能参与进来,继续探索这份“数学美感”背后的可能。( I. b5 Y7 w4 G* M- X
02 顶
% ~) F( D% A" i# V. M1 X. u- Y天
9 J: X/ e7 Q- T9 [4 }立& ? N4 m& r/ u+ X" y) Y9 s; H4 a
地( j9 H- b1 V# y' o' o, ^9 ?
- “既仰望星空发表论文,也脚踏实地算法落地” -: ~# t! o# @ a# W: l- p& d; _5 s
“高科技应做到‘顶天立地’。”是王选先生一生奋斗的信条。“顶天”即不断追求技术上的新突破,“立地”即把技术商品化,并大量推广、应用,而“顶天”是为了更好地“立地”。' r0 V2 C% F$ x. F" D3 p# h
杨仝科研之路的开始并不顺遂。2015年,他来到北京大学做助理研究员,转向网络测量这个新领域,起初的几年论文几乎全部被拒。当时实验室里的学生都是年级里名列前茅的佼佼者,可新领域的陌生感、论文屡投屡拒的挫败感,让杨仝难免担心:这些优秀的学生会不会因为看不到成果而离开?' K" w& f4 r5 T E$ J) u; z* }
让他欣慰的是,这群学生选择了坚守,甚至常驻实验室潜心钻研。终于,2018年,历经半年构思和撰写,杨仝团队成功发表了北京大学首篇SIGCOMM论文Elastic Sketch。SIGCOMM是计算机网络领域公认的顶会,“零的突破”分量不言而喻。$ u5 z' z( Z! j9 [9 x
这篇破局之作中,最关键的突破源自睡梦中的灵感。“当时突然想到,分流之后可以做一次压缩,按理说压缩会让精度变差,但如果和直接构建的结果对比,精度反而能提高,给人一种‘越压越准’的感觉。”
5 U4 J7 g1 R( j6 R一次次看似偶然的思维火花,源于长期的艰苦思索,更源于对科研发自内心的热爱。他刚起床就立刻给学生周洋打去电话,迫不及待地分享这个思路。3 D' l f4 T! q, w& o: U6 X9 G* i
最终,Elastic Sketch通过巧妙的压缩设计,加速的同时不仅没降低性能,反而实现了反超。相比当时的主流方案,Elastic sketch的处理速度提升44.6~45.2倍,错误率降低2.0~273.7倍,还能适配P4、FPGA、GPU等六大平台,完成六种典型测量任务。
: ^ t) F, t; r" }4 ]% N2 e这成为杨仝“顶天”之路的坚实一步,也打开了与华为“立地”合作的大门。华为南京邀请他参加“网络天下论坛”做报告,报告结束后,华为的郑晓龙博士主动找上门,提议将论文中的新算法应用到实际项目中。不久之后,算法落地到华为芯片生产中。+ a& R8 [ N" b9 f2 l; b# V
与华为的合作一直持续了八年,杨仝透露,自从首个算法嵌入芯片,他与华为合作越来越顺,并6次获得华为火花奖。所有合作项目中,80%都被评为优秀,而华为项目的优秀率通常不到10%。
6 K6 P: O0 {4 q O, A4 ?9 C* c v% Z2 x六次火花奖3 K: d& x- {! c: ^
上下滑动,查看更多
+ K; J2 a1 U! V- U( q* R2023年
/ a: p5 y& r, j* v$ q在珠峰会战难题“IPv6数据面查找算法”中提出降低片内内存的高价值方案
& q6 F) u5 @0 {" u$ m3 i2023年! l2 s9 x/ u8 q: T; p9 B+ B
在高性能难题“基于微流的高性能转发调度模型”中提出高价值方案; y G' A2 R6 k4 D; b
2023年9 e/ a/ \! l$ z: W: J' [5 e
在珠峰会战难题“[自动驾驶网络]资源约束下百万数据流统计/筛选算法”中提出高价值方案7 J) H8 t& v* L" B; C& {7 Z' r: a
2024年
5 F6 E7 P, ^; ^4 v) L在华为云难题“[网络测量]面向海量真实业务流的软硬协同测量技术”中提出了高价值的架构与算法
& ]9 J9 m0 b/ Q3 I v2024年
6 b4 Q+ r+ c% ~/ ?# v在算力会战难题“MOE训练的动态专家负载预测技术”中提出高价值方案
1 N" i2 L; a- t' ]! V4 Z2025年
! d; ~% q C# l5 l/ @+ p; }在珠峰会战难题“网算协同推荐系统卸载算法”中提出了高价值算法
# S0 `. T4 e/ v5 m V2 V近期杨仝团队提出AgentRob框架,打通了LLM智能体落地物理世界的新路径。该框架实现在线论坛、LLM智能体与物理机器人三方贯通,用户只需在论坛中@机器人,即可直接调度现实中的机器狗、人形机器人完成任务。它将智能体与机器人的交互融入人类可读的社会语境,有效验证了社区驱动式机器人协作的可行性。(论文地址:$ Z3 l8 g5 |8 T5 q. h. }9 m
https://arxiv.org/abs/2602.13591 开源代码GitHub:
" A* b- {5 f N% w2 Ehttps://github.com/PKULab1806/AgentRob)! J3 G1 O0 g! q0 N ?, S' w
近年来,杨仝团队发表CCF A类论文100多篇,和小米、360、开物等多家企业均有合作,并成立了3个联合实验室,坚持把研究成果转化为解决实际问题的有效工具。从科研“顶天”到应用“立地”,印证了“科研既要仰望星空,更要脚踏实地”的初心。
_& u; ]! J q3 ]) @6 L03 师
6 E: H2 f0 n t+ } j t" S# G8 ?门, \1 H) N( p2 J) \' s$ a
传' k: f- p' B+ N$ K M/ O
承5 k; j1 ?1 \6 V7 H) J5 S
- “我们实验室没有改不好的bug” -" m9 H6 u8 B; D1 v9 z: h
学生时代,杨仝是不折不扣的“天才少年”,曾在全国计算机专业顶尖的三个地方读书和工作:在清华读博,用三年拿到学位;在中国科学院计算所做一年研究后,来到北大踏上研究员之路。, |; R N, @4 | m: Y
如今,杨仝的实验室汇聚了更多 “天才少年”,累计有百余名背景各异的学生。这里年龄最小的学生仅17岁,有IMO、IOI、IBO等多项国际竞赛金牌得主,还有高二就拿金牌、通过预科提前进入北大的少年班学子。
) Q& V v, W" s+ P2 J! Q管理高密度的天才可谓是千古难题。而在杨仝的实验室里,这群顶尖学子相互碰撞磨合,却迸发出奇妙的化学反应。杨仝笑着说,大家总觉得计算机学生偏内向,不爱说话。而实际上,实验室里的学生分成两类,一类善于表达,一类沉默寡言。他们总能互补着形成“搭子”,让实验室氛围既活跃又踏实,各抒己见的同时能够通力合作。" A8 `: g; S1 _5 V, T' q7 N
有时间就和学生饭堂约饭,面对面沟通
7 L7 k; ]+ k: Z2 z8 v) ~9 {/ ?& w在杨仝的引导下,实验室有如一个亲密无间的大家庭。学生们根据研究方向分组合作,学生作为项目技术负责人与他高效对接工作。而杨仝自己则更像一个大家长,实验室百余名学生之众,他仍能和每一位学生定期沟通。为此,他几乎每天都与同学们一起约饭,了解每一位学生的近况。让他欣慰的是,学生们不仅成为科研伙伴,私下里也亲如家人,经常聚会、出游,偶尔还会互相借住。遇到困难永远有人热心帮忙,谁的代码卡了壳,其他同学都会主动帮忙debug,即使忙到深夜也从未抱怨。杨仝笃定地说,“我们实验室从来没有修不好的bug”。
" u. ~/ q* |5 Y5 E0 Q( _有事一起扛、有难一起解,这份默契让这个汇聚“天才少年”的团队,不仅有顶尖的科研实力,更有令人感到温暖的凝聚力,在探索未知的道路上稳步前行。
2 \ f. @. \+ @) _5 d7 V) }! k' M“虽然没有硬性考核,但看着实验室里这么多顶级学生,你会觉得不做点大事,都对不起他们的天赋”。这份责任感推着他不断追求首创、追求极致。
5 P- s! Y% b' U! q: {1 ?杨仝与学生讨论问题 6 U4 D" [. \3 L
生活中,他始终保持着规律的作息,每天7点准时起床,早早抵达学校。实验室的清晨格外安静,正适合沉淀思考。稍晚的时候,各类项目会议、团队讨论会陆续开始,排满一整天,直到深夜才能告一段落。就在采访前一晚,杨仝还在和团队讨论如何使用GPU加速数据库查询。在繁重的工作之余,杨仝坚持健身、打乒乓球,保持头脑清醒。# b% T6 X& T% T8 u4 {6 a. J, V
对他而言,科研从不是负担,而是拥抱心底的热爱。每一次灵感迸发、发表论文、获颁奖项,那种探索未至之境的享受,是任何东西都无法替代的。杨仝说,中国上下几千年,科技高速发展却只有最近几十年,年轻人出生在最好的时代,也是最能做出最大贡献的时代。他觉得,这代年轻人拥有前所未有的机遇,只要珍惜时光、追随热爱,就有可能为行业进步、社会发展、国计民生贡献巨大力量。
5 B- N! b5 H1 K! {# N, J3 t人物简介
, C7 O0 ]5 ?) B' ~杨仝,北京大学PKU-DS实验室负责人,北京大学计算机学院研究员、长聘副教授,北京大学人工智能研究院研究员,教育部青年长江学者,北大-小米大模型联合实验室主任,北大-360大模型联合实验室主任,北大-开物金如意人工智能联合实验室主任,北大临港-九章云极大模型联合实验室主任,北大临港大模型研发中心主任。主要研究方向为大语言模型关键技术与概率数据结构。实验室云集了众多优秀本硕博学生100余人,包括IMO、IOI、IBO、IPHO、NOI、CMO、CNBO、CChO金牌。近年发表一作/通信作者CCF A类论文100+篇。提出首个复数大模型iFairy和复域变换Fairy2i,实现了2比特的量化精度超过了量化前16比特实数大模型。课题组研发的FairyR1模型以5%参数超越DeepSeek满血版R1的数学和代码性能,已在北大校园网提供大模型服务。获得中国电子学会技术进步一等奖(排名第二)、6次获得华为火花奖(全国最多),1次奥林帕斯先锋奖。研究成果获得了国家自然科学基金委员会网站4次报道、教育部科技发展中心1次。3 `9 j! C" n, s
彩蛋复数大模型iFairy和Fairy2i开源地址3 o+ S$ H7 Q5 Q
这是杨仝老师团队开发的大模型开源地址。包括 iFairy、Fairy2i 的模型、代码和平台入口。想进一步了解大模型的读者不妨探索一下!
" l7 D$ D5 N% FiFairy
, T2 v C' v7 S$ @" nModel-700M: https://huggingface.co/PKU-DS-LAB/Fairy-plus-minus-i-700M4 W1 I* @0 F' v9 l. J" X# @
Model-1.3B: https://huggingface.co/PKU-DS-LAB/Fairy-plus-minus-i-1.3B
7 g% C1 `- {2 W) u4 I [ eCode: https://github.com/PKULab1806/Fairy-plus-minus-i* h7 d; ~ S* A1 j
Model Scope:https://modelscope.cn/models/PKU-DS-LAB/ifairy-full-700M
& M- [; g9 [2 P4 c. e$ _https://modelscope.cn/models/PKU-DS-LAB/ifairy-full-1.3B
; C8 H5 \' G8 V/ Y% tFairy2i0 V& l G% i* j% p- F5 a
Model:https://huggingface.co/PKU-DS-LAB/Fairy2i-W23 L2 F g3 Z, T9 u0 i
Code:https://github.com/PKULab1806/Fairy2i-W2
+ k+ N* k: m7 s7 iModel Scope:https://modelscope.cn/models/PKULab1806/Fairy2i-W2) P4 G, Z( g) M4 r& W6 Z
0 L' `5 v, F$ S6 W* Q+ E- q来源 | 北京大学融媒体中心、北京大学科技开发部
9 _0 }0 I: _& w采写| 骆锦锦、张矣可4 t) F7 Y G3 D; {; q
图片| 朱成轩! b c7 c. P. D5 J
排版 | 唐儒雅4 A9 K& Q. Q6 F6 N5 _6 c' _
编辑&责编 | 郭雅颂, o7 x1 |* T9 G* Q
<<左右滑动查看栏目>> |
|