|
编辑:元宇
' t/ U; b& ^5 o5 u. x【新智元导读】如果科研中的文献阅读、代码演进、实验验证都可以由智能体自主完成,科学发现的方式会被重新定义吗?自主科研智能体(Autonomous Research Agent)的兴起,正在把这一设想带入现实:科学家有望回归科学品味和探索源头,智能体承担科研全链路的繁琐工作,两者在人机协同的闭环中共探新的重大科研突破。
0 y) m2 ]+ |1 f0 u: E: X0 w7 x3 o( i9 F% Z. n) K9 G
. E& a0 h. ?6 q
AI与科学双向奔赴的当下,在以Cell、Nature、SCIence(CNS)为代表的全球顶尖科研「殿堂」中,科学智能(AI for Science,AI4S)成果愈发受人瞩目。3 J3 J8 O: T6 X8 y6 I3 \
然而,在传统科研范式里,AI大多扮演着「被动待命」的静态辅助工具角色,其应用依赖人类科学家从问题定义、模型设计到结果解读的全流程主导和反复推敲。
$ g- E: `& M3 M0 C7 |8 ~" e. ?9 m当面对CNS级别的科学命题时,这种「人力主导」的模式在超大规模高维数据面前,早已触及认知与效率的双重瓶颈。
1 c, L k" j# x, M9 j在此背景下,自主科研智能体(Autonomous Research Agent)的兴起,表明科研范式正迎来重大跃迁。
2 r, Z& a$ Y) ~5 u3月1日,在上海举办的「星河启智·超级科研合伙人发布大会」上,由上海科学智能研究院(下称上智院)和复旦大学主办的第四届世界科学智能大赛之「AI4S智能体CNS挑战赛」正式发布并启动报名。+ f8 _! h: `2 C; s" s0 V# j0 |# w) n
该比赛聚焦自主科研智能体,设置四项挑战任务,要求参赛智能体在零人工干预条件下,独立完成文献理解、代码重构、假设提出、实验验证与结果迭代,并在此基础上挑战并超越CNS等顶级期刊已发表成果及同等级研究的当前最优水平(SOTA)。 y0 m* r5 ~$ C9 R& p
「科学智能最终要靠年轻人来突破。」
7 s) B+ j, E! H8 _复旦大学校长、中国科学院院士金力发布会致辞中指出,直接让智能体挑战CNS级别的科研问题在两年前不可想象,如今AI正在拉平科研的起跑线,年轻人的「异想天开」不再因为缺少「超级科研合伙人」而被浪费,这比任何一篇顶刊论文都重要。
- O J3 V' R+ S, \% ]( ]5 ?. N8 j/ o: ]
! X* D& h- w' Q: l4 J% Z
(复旦大学校长、中国科学院院士金力,复旦大学学术委员会主任、中国科学院院士龚新高,复旦大学校长助理、上智院理事长吴力波,复旦大学复杂体系多尺度研究院院长马剑鹏,上智院院长、复旦大学特聘教授漆远,上海人工智能实验室主任助理、领军科学家乔宇,上海祖泉创新转化研究院院长、复旦科创董事长孙彭军,上海未来产业基金总经理、上海未来启点社区理事长魏凡杰,复旦大学数学科学学院研究员任潇,复旦大学研究员、上智院AI科学家屈超,共同发布挑战赛)
$ }( m5 b0 ?$ M q4 |0 F作为第四届世界科学智能大赛的创新赛道,AI4S智能体CNS挑战赛以挑战并超越CNS级科研成果为目标。
, }/ z4 P& z) Q3 ?与这一挑战强度相匹配,赛事评审委员会由多位在CNS级科研成果领域具有广泛影响力的院士和顶尖学者组成。4 c: y0 }2 g) p, ~2 O# U% b
评审委员会阵容包括复旦大学校长、中国科学院院士金力,复旦大学学术委员会主任、中国科学院院士龚新高,复旦大学教授、应用数学中心主任雷震,复旦大学教授、复杂体系多尺度研究院院长马剑鹏,复旦大学教授、附属华山医院神经内科副主任郁金泰,上智院院长、复旦大学特聘教授漆远等,共同确保赛事的科学深度与专业标准。# L+ C8 S( Y/ o/ ^. w7 Z/ W# o
作为全球具有影响力的科学智能赛事,世界科学智能大赛已连续举办三届,吸引来自30多个国家和地区的4万余名选手参与。
8 k- d( M3 U( W [! q5 k赛事坚持开放科学问题、数据、算力与工具,推动人工智能与真实科研场景深度结合、持续培育跨领域科学智能人才生态。
+ H* W* P7 N1 q7 t5 ^ L* M, b+ ]本届大赛由上海市科学技术委员会、上海市发展和改革委员会、上海市经济和信息化委员会、上海市教育委员会等多部门联合指导,由上海科学智能研究院(下称上智院)与复旦大学联合主办,旨在面向全球广纳英才、探索人机协同推动重大科学突破的新路径。
3 `3 H: j; q) o! U0 C {7 n5 Y' b/ A: u: K) e) i7 h
# @# {& K {( A3 c! o- k ^
' T; g! c) F! r" J4 b( r6 }) X; k2 [
5 G* Q6 C9 J1 I( |5 |' w/ t4 @' d% B7 M
( Y$ Z# F+ O' M4 a$ S! I* k四大任务 ' q: E+ I5 y" c) f* m2 B
自主科研智能体挑战顶级成果SOTA & S. K) q% T9 v" r0 m* V
这场赛事试图组织科研技术新秀回答一个关键问题:智能体能否深度参与并推动顶级科学问题的解决?% S, H: ]9 g8 k; Q
赛事聚焦于自主科研智能体这一新形态,将分为初赛、复赛、决赛三个赛段,共设置四项挑战任务,包括:高通量药物虚拟筛选优化、靶向分子设计与逆合成规划闭环、蛋白质构象系综生成挑战以及神经算子自动改进。$ R) p( m4 F& a; M1 j( w- w4 @
8 z1 K2 V" C# O
/ n: F; R/ E: y- P+ g# a任务一: r' E7 ?( a* O3 T6 ^/ t$ K
DrugCLIP高通量虚拟筛选优化智能体
9 z: {. Q l; t1 K8 ]; s
4 J2 ~0 R# K5 O3 C% o$ O z. B, r' P! F6 P& s; r F2 }# Z
该任务聚焦AI在生物医药领域的全基因组药物发现应用,依托发表于Science的DrugCLIP深度对比学习技术。
( p) i; |' ~1 Y5 t" e选手需要构建一个能自动化完成「数据准备-训练/微调-评测-超参/策略迭代-结果汇报」全流程闭环的科研智能体,自主探索优化策略并提升EF1%等核心指标,旨在系统性优化DrugCLIP虚拟筛选的表现与效率,为突破传统药物筛选的算力瓶颈、实现全基因组尺度虚拟筛选提供创新技术路径。
7 _8 L9 {: a. l# O) L
% a' H5 Y; s& C6 s% m# {3 _* F
* n% w6 a9 f6 V2 X$ L x. R4 B9 Y0 ]/ E4 V7 q
* u+ s& Q4 _5 O5 C5 O; n任务二, e3 C; ~; [/ b- H
靶向分子研发与合成规划智能体
" r# Q; U. F6 d, y- o" f' j
" Z* Z( c" \" t) E! k1 s2 w0 w
9 _8 i) X" c. {& V) S该赛题围绕AI在化学合成领域的落地应用,旨在破解先导化合物发现与优化耗时久、投入高的行业痛点。
/ w- w5 T0 v% O/ v9 t5 J选手需依托深度生成模型、强化学习等AI技术,结合顶刊前沿的智能化学研究方法,构建能高度自动化完成「分子生成-性质筛选-逆合成路线规划」全流程的智能体,兼顾分子的化学合理性与合成可及性,实现指定时间内的靶向分子设计与合成路线规划闭环,推动新药研发全流程的自动化与自主化。/ K3 [! ?2 \3 ^5 n
2 Q+ C" T) m$ ?- H- G5 U
9 S5 V( C8 V n2 z$ W) `8 a
$ E! ~5 {+ D# u3 I5 k
3 x3 b6 d7 E- b3 L3 F任务三9 }( ?: s1 P6 ^" w
蛋白质构象系综生成智能体 }% r: }: K0 \# _ J( g
- i. R" c" Y# k. m
) y+ f2 X2 _ h; \6 [/ Z" N该赛题旨在解决计算生物学领域的前沿难题——蛋白质动态构象系综生成。* ^: R: Z5 y8 p2 V/ N1 `9 r( [
赛题以BioEmu(Science,2025)、STARLING(Nature,2026)等代表性工作为核心参考,引导选手开发能够模拟顶尖科学家思维、自主完成「文献调研-模型设计-代码实现-自动化训练-评测-论文撰写」全科研生命周期闭环的智能体,推动生命科学大模型与自主科研Agent交叉融合,探索下一代AI Scientist范式。
- c F# y% s+ C/ E: p1 F; ?6 d! u/ e' x4 d" D- ]
: _- X, n0 U" y: m# k
: B5 `* I* D) v2 v" c9 d" c4 f# E/ r* G* r; j' I9 M
任务四) x6 @9 F; s$ w
神经算子PDE智能体& O; O0 R F+ K) `; J# X
. S# `/ e5 y" ^3 i( A$ U5 a
8 g# S! O, U- X
该赛题立足于神经算子对复杂动态物理系统的建模与求解难题。
: D; f# M- _$ y3 p/ V6 E8 z$ q选手需以FNO、DeepONet、ICON等代表性工作为基线,依托PDEBench标准科学数据集,开发一个能够自主完成「理解-改进-验证-复现」全科研闭环智能体,而不仅仅是提交训练好的模型权重。
1 G* C/ Y, N1 J% A助力突破现有神经算子研究中依赖人工干预、长时稳定性欠佳、效率与精度难以平衡等痛点,推动神经算子从「静态模型优化」向「自主科研」范式跃迁,为数值模拟、流体力学等关键领域突破提供创新技术路径。6 b2 M$ r/ T; U8 m: F
l0 _3 j1 y R! ~/ g1 y3 D' T( z# M \6 T
" H# A0 x B$ r8 w . D% Z; @4 R( D; c k9 G3 n4 C
$ X+ S# v, R0 R' @; r0 b. _- @! f; U3 ]# c. s
构建科研闭环 ; f* ~3 {$ Y2 H ^; {% K
参赛智能体须有四项自动化能力
P& i; r; L' V: R7 V* K1 s1 X作为一次面向自主科研智能体的前沿赛事,挑战赛的核心在于检验智能体是否具备完整科研闭环能力,参赛智能体必须在以下四个关键阶段实现高度自动化:
% l) f% u. W/ T5 `1、文献解析与逻辑解构:智能体应具备深度的多模态阅读能力,能够自主研读顶刊论文及其配套源代码,精准理清底层数学公式、数据流向、核心算法逻辑以及科学问题的本质。2 m+ P% p1 i+ M/ J& t
2、瓶颈诊断与假设提出:面对既有模型或未解问题,智能体应通过分析原始训练日志(Log)或科学数据,敏锐识别在计算效率、模型泛化能力或理论覆盖面上的痛点,并自主提出具有科学依据的优化假设或求解策略。
: t& o. i8 B A5 L! K/ y3、自主设计与代码演进:突破「黑盒调用」的限制,智能体应根据其诊断结果和科学假设,制定具体的工程方案(如重构网络结构、设计全新的损失函数或引入外部科学工具),并直接编写或修改高质量代码来实现这些创新。
8 a/ H4 j! ?* p7 F4、实验验证与科学迭代:智能体应在测试环境中自主运行干实验,管理多分支的实验版本。通过对实验结果的高效分析,判断当前策略的有效性,并据此调整方向,完成自我进化的科学迭代。" B6 t0 c. u2 {) E s
为确保赛事的公正性与前瞻性,评测将完全基于标准化的干实验数据集,从以下三个核心维度进行加权综合评分:$ |' g/ ~2 e, M( W
1、科学性能:量化评估智能体优化后的模型或提出的解决方案在特定科学任务指标(如预测精度、泛化能力)上的表现,考察其应对CNS级别科学问题时的突破程度。
( C9 K5 S- R$ B+ {. K# J2、探索效率与计算经济性:在追求科学突破的同时,评估智能体完成自主科研闭环的效率与资源消耗,包括完成科学发现所需的计算时间、迭代周期以及计算资源的优化利用。
8 j. x( L. ?! N6 b/ g4 a, O D3、演进逻辑严密性:考量智能体决策链条的逻辑透明度与可解释性——即其发现问题、提出假设并最终演进代码的过程。
" N6 p$ J( {, j6 }6 C# O, j挑战赛赛题组组长屈超表示,这场赛事不仅检验智能体的表现,更是对其背后研发团队的科研思维、工程能力与科学素养的综合考验。
/ Y" O7 p- d3 K7 _希望通过这一高规格平台,推动高能动性智能体加速成熟,助力科研范式的深层变革。& l1 Q% b3 t# |5 h
0 h( R: |% b) K- f" x, r" i
: F1 _9 X% e3 Q
0 C: b5 V: j3 O, n
+ E' Y' }: R& n- H) }1 ]2 w- ^7 Z
% f( u- ?; w) A# h
1 {. U ?7 ~2 r" C6 n$ r全球首个自主科研Agent挑战赛启动报名 + }" m/ t5 ^0 n" q* c
经三届积淀,本届大赛依托高能动性科研智能体「大圣」实现全新升级,推出全球首个自主科研智能体挑战赛。
% Y3 w- W8 k8 C1 \6 r+ I「大圣」是由上智院、复旦大学、无限光年共建的星河启智科学智能开放平台推出的系统级科研智能体,融合多模态基础模型、长周期多线程的群体记忆、专家级科学Skills、自驱动实验室与安全可信方案,正面向真实科研场景不断进化、推动科研范式变革。
" ^! y/ \& n" j j) F作为主办方代表,复旦大学校长助理、上智院理事长吴力波在介绍本次挑战赛表示:2 f5 i9 _8 ?7 j8 w1 ?- ]" G
登上CNS级别的科学研究舞台,核心源动力是科学家对关键问题的敏锐洞察与独特研究视角,这也是推动科学智能发展的关键所在。因此,本次挑战赛将让科学家回归科学问题探索本身,由智能体承担科研全链路的繁琐工作,探索在人机协同的闭环过程中实现重大科研突破的可能性。
# U% h* S! `# M
2 A8 F4 h- P8 \" `* [) r2 ^6 f1 F0 s3 Q% F$ H
g: h: U% {; [, `
1 h9 r4 u# s5 @4 D* u9 [, [' c: `本次AI4S智能体CNS挑战赛设置的四项核心任务,将成为检验智能体自主科研能力的试金石。0 O8 b6 L$ f. ]+ m6 n) ?
挑战已经开启,欢迎更多有志于探索科研智能体边界的团队和个人报名参与。1 V1 V: C$ a: b! Z, Y
一个月后,第四届世界科学智能大赛全部赛道也将正式发布,敬请期待!& y2 K" A" P! O& n( A3 w1 ^
PC端报名第四届世界科学智能大赛之「AI4S智能体CNS挑战赛」
* n8 d$ |8 Y. P. l( Qcompetition.ai4s.com.cn |