|
|
来源:市场资讯
$ E% t$ B) ?6 V/ e" N; L3 u(来源:PaperWeekly)0 @7 F. l8 y% ]$ [
当 AI 从单个助手进化为成千上万个智能体协作的生态,未来的智能体服务会是什么样的?9 Q4 `% E7 n( t& T% P- ?
5 s! I! g% v( K
/ u6 z/ m) e; x& I论文标题:
" j8 Q0 r8 A8 f8 T# g- wColorEcosystem: Powering Personalized, Standardized, and Trustworthy Agentic Service in Massive-agent Ecosystem$ r0 w) K2 A0 R5 p* \- G6 ?& {3 @
论文地址:
8 h# `" Y+ L5 \% D! @https://arxiv.org/abs/2510.21566- K9 w( |0 S' U4 h
开源地址:
# H2 x5 q+ R! p4 O* p1 E) k- ?https://github.com/opas-lab/color-ecosystem
9 v- u* N H# D* s- d; y共同第一作者吴方文为 OPPO 研究院高级机器学习算法工程师。共同第一作者吴铮为上海交通大学计算机学院一年级硕士生,导师为张倬胜助理教授,主要研究方向为(多模态)大模型及其智能体。通讯作者为 OPPO 研究院数据智能研究部部长王俊。
$ `6 ~6 |' {" t2 k4 S# _ B( ?+ y随着(多模态)大语言模型在规划、推理及决策等领域的飞速发展,智能体服务正经历从单智能体到多智能体系统,再到海量智能体生态的范式演进。 然而,现有的海量智能体生态正面临体验同质化、缺乏标准化以及行为不可信等严峻挑战。
+ s- J7 T: J9 |% \近日,来自上海交通大学和 OPPO 研究院的研究人员等提出了一项名为 ColorEcosystem 的全新蓝图,为海量智能体生态构想了个性化、标准化且可信的服务生态。
* _$ Z5 r1 \( n1 y
6 Q" J' ?5 |% Y$ b
- E9 G- E0 Z2 S8 a; Y
4 V1 n6 C1 Z6 ]& D4 \
. P. q ?* @4 H$ {0 Q* m从“单体”到“生态”:智能体服务的演进过程与挑战
/ ?8 [! }. X, X5 X6 M作者指出,智能体服务的发展可分为三个阶段:" L/ d1 m. _) t. E* |4 i
单智能体阶段:以 LLM 为核心“大脑”,通过外部工具完成特定任务。 & ~* ]: q0 L5 l2 E2 r6 a% G* J
多智能体系统:结合具备不同功能(如记忆、推理)的智能体,处理复杂任务。 8 r& o3 ^8 K7 a
海量智能体生态:开发者通过标准 API 发布服务,用户自主选择调用,形成繁荣的市场。
' K7 u" T; N" e. O
7 _3 _& b, P6 ?$ C. P1 U- x$ ^! M" N3 W0 `% r3 [
但在迈向这一愿景的过程中,三大挑战日益凸显:
3 m+ D8 l" _5 Z非个性化体验:智能体往往提供通用服务,难以理解不同用户间的隐性需求差异(如饮食偏好)。
+ D$ j( n- {2 l' q3 G& Q p- U8 {3 X0 G缺乏标准化管理:不同开发者采用的协议各异,导致用户调用困难、企业定价混乱。
: I6 |$ x+ }, z0 `: Q. N* Q不可信行为风险:恶意开发者可能植入木马,而恶意用户也可能利用智能体进行网络攻击。 5 z9 o9 q+ ~- s8 g. ]+ M1 o* n
9 L+ ?; a, l1 s# j4 G( F7 C5 M9 H3 P. M# X0 j% j
ColorEcosystem 三大支柱:智能体载体、智能体商店与智能体审计' E5 Y3 ^: m: d% Y3 r) n8 s3 g0 Y
" y- v& J5 D% A6 Z" z. K6 k+ I
, a, P& O' V) a0 M( D) q$ g
在 ColorEcosystem 中,人类的角色分为两类:开发者和用户。
0 B! f* N W1 G! c3 _; a' s) z对于开发者而言,他们开发的智能体服务必须先通过智能体审计。通过审计后,该服务将以标准化格式发布到智能体商店中。0 |8 x2 z, m1 f: F( k
对于用户而言,每个用户都拥有一个个性化的智能体载体,用于存储已授权的个性化数据和记忆。
( i- A; { {+ T9 L/ O0 W. {一方面,用户 Alice 的智能体载体可以与用户 Bob 的智能体载体通过智能体协议进行通信,从而实现用户之间的互动。' F' ]2 S. M, n9 c- L& P8 {
另一方面,用户可以从智能体商店中选择自己需要的智能体服务。随后,智能体载体将结合用户的个人数据(例如,一个点餐类的智能体服务在执行时会考虑用户的口味偏好),对这些服务进行个性化调用。 J5 h3 e+ j- a+ P
针对智能体服务,ColorEcosystem 指出,未来的海量智能体生态应该向由 Agent Carrier(智能体载体)、Agent Store(智能体商店)和 Agent Audit(智能体审计)构成的三位一体架构迈进。
Q1 f& W% l$ x4 y1. Agent Carrier:打造你的“数字分身”
/ D. a: W/ L+ d0 N u9 z w/ i
# [/ M( B6 m; g0 l/ U5 E0 O
% |' g& h* s2 X
Agent Carrier 是将智能体转化为个性化智能助手的重要手段,主要包括两个核心机制。$ m9 h4 p, O' C' M
第一个核心机制是用户自主选择智能体服务。用户可以从智能体商店中选择所需智能体,并添加到自己的智能体载体中。
4 E1 q1 M" h( I, Z5 _% v' _这意味着智能体载体并不包含商店中的所有智能体,而只包含用户选中的那些。就像应用商店一样,用户下载应用后,只有已下载的应用才会在手机上运行。2 J, m% i: t! ~) ^
第二个核心机制是能够访问用户授权数据的数字分身。用户将部分数据授权给数字分身,包括历史轨迹、某些应用中的搜索记录,以及个人信息和偏好。" b: f; j" {# Y- L( @8 d' U
用户从智能体商店调用的智能体服务,可以通过数字分身对用户数据的分析,以更符合人类意图的方式执行。由于智能体之间可以通过智能体协议相互通信,用户之间的交互可以简化为数字分身之间的通信。; ~& E( j$ X! l8 p+ K
2. Agent Store:智能体时代的“App Store”
! u! B8 F# J3 D$ i+ l Y* p
4 p0 a$ u5 N" q1 ?2 V* }( R
: c5 e/ I) {- }1 ~& Q为了实现标准化,在一个大规模智能体生态系统中,理想的情况是智能体能够自主、自动地完成用户给出的指令,从而使得传统的应用商店里基于图形用户界面的应用变得不再必要,用户只需要在通过购买智能体服务就可以满族用户的基本需求。2 G5 T" h7 h: t7 v) w2 q
Agent Store 是一个为大规模智能体设计的标准化管理平台。与应用商店类似,开发者可以将其智能体服务发布到 Agent Store,供用户下载和使用。这种方式能够有效整合海量的智能体服务资源,使用户能够更便捷地获取最适合其需求的智能体服务。* z7 m1 I' a# y' B" y
同时,Agent Store 会利用用户授权范围内的信息,结合用户当前情境与长期心智画像,智能推荐最契合其任务目标或个人偏好的智能体服务。" p9 j( L/ J, o3 D* z
通过“用户心智驱动”的分发机制,大大降低用户在智能体海洋中的选择成本,提升服务匹配效率与满意度,真正实现“千人千面,主动适配”的智能体服务生态。
; S" u" Q* [# h. m相比 Coze 或 GPT Store,ColorEcosystem 试图构建一个跨模型、跨平台的统一智能体基础设施。它具有更强的扩展性,支持各种领域私有模型的接入,并在用户实际设备上实现无风险执行。
$ R2 Z2 k1 e: t! q/ j& B: M/ v3. Agent Audit:双向的安全护栏: ~, e( h$ O2 v: e: C2 t% @6 W! f0 @: O2 r
0 J: t+ O6 c) P: n, Y
$ `8 y5 {, D8 y5 S, ?信任是生态基石。Color Ecosystem 要求所有活动必须经过权威第三方的审计:
* K+ A' f, z/ N( H& v在开发者层面,智能体审计必须包括安全审计和信息审计。安全审计指检查智能体服务是否存在安全隐患:一方面,智能体服务可能因开发者疏忽存在漏洞;另一方面,恶意开发者可能植入木马、病毒或后门。
8 q T( C% n4 z7 P3 K5 N智能体服务必须在零信任条件下全面通过审计测试,才能发布到智能体商店。信息审计指核实智能体服务是否包含完整的使用说明和开发者信息。用户需要知道如何使用该服务,并在遇到问题或需要支持时能够联系到开发者。+ C/ y+ B% W- B3 g o8 x
在用户层面,智能体审计必须包括行为审计和内容审计。行为审计旨在检查用户是否利用智能体服务从事恶意活动、对其他用户或公司造成损害,从而确保本意良善的智能体服务不被恶意用户武器化。
2 u. o0 P% e% M4 L: T/ \$ u$ b内容审计则确保用户通过智能体服务生成的内容不包含诽谤、歧视、暴力、色情或其他不良信息,从而维护健康、良好的生态。* G2 y% V5 w- D
为保障上述审计的有效性与全面性,Color Ecosystem 还需建立一个受控的沙箱执行环境。所有待发布的智能体服务以及用户与智能体的交互行为,均需在沙箱中进行充分的模拟执行与动态测试。
+ {8 R( v9 H5 n在沙箱中,审计系统将模拟真实但隔离的运行场景,主动触发智能体的各类功能路径,监控其系统调用、资源访问及数据处理行为,从而在无实际风险的前提下揭示潜在的安全隐患、越权操作或信息内容违规。
0 d* ?/ o8 X. i, @' ^; S+ c5 ~; E只有通过沙箱模拟执行验证,确认无恶意行为与不良输出后,相关智能体或用户行为方可获得生态信任背书并进入正式环境。
& u$ g- \( A, z4 s+ C/ R: ^
( I. x2 U* M0 k$ j
0 Y2 e9 t4 `7 q& M6 \通往未来的演进之路7 p$ g$ G/ ]0 v2 [# [
研究团队坦言,构建完美的 ColorEcosystem 并非一蹴而就。针对现有的协议覆盖不足和审计难度,他们提出了过渡方案: . F( L- Q0 \ U, M" y: z, E* h
1. 在现有智能体服务无法覆盖每一款智能终端设备的全部应用场景时,我们可以将 GUI 智能体作为智能体服务部署在智能体商店中。
4 x3 ` g( y. e S' ~3 j( zGUI 智能体是一种通过分析当前屏幕画面和用户指令,模拟人类交互(如点击、输入、滑动等)来完成用户任务的智能体。由于 GUI 智能体不需要访问特定的环境 API,因此具有较强的泛化能力,可以操作任意智能终端设备。/ |/ h1 e R7 w3 H
虽然相比基于 API 的智能体服务,GUI 智能体可能耗时更长,但它们可以弥补当前智能体服务覆盖不足的问题。
' o1 o' l6 U k$ j8 ^7 Y2. 关于智能体审计难以建立的问题,我们认为,现有生态系统中各大厂商已经建立的、仅基于行为监管的机制,在一定程度上能够约束智能体服务的恶意行为。3 B- j r# N# x1 u8 o) w! _
尽管基于行为的监管机制存在固有的滞后性,但它能够以最低成本实现对海量智能体服务的监管。
Q1 ]. @9 i. S, k另一方面,虽然短期内难以建立集中式的智能体审计,但少数厂商可以形成去中心化的联盟链智能体审计机制作为过渡方案,等待时机成熟时再向集中式智能体审计转型。
% R7 T6 O; u1 f$ c$ ]6 S此外,ColorEcosystem 还考虑了激励机制,通过基于 Token 使用量的支付模型吸引交易驱动型开发者,并通过增加曝光量来支持内容驱动型(开源)开发者。
4 y7 p' V) p$ g" ^- z6 B
$ S* s0 ~$ ]/ m4 R
- P" G: r W6 d总结# H! j- X( A( A& |$ i8 h, G: R
如果说 GPT 时代定义了‘智能对话’,那么 ColorEcosystem 试图定义的是‘智能体互联网’的基础规则。( F1 f2 k* d- h$ ~, E
ColorEcosystem 的提出,为下一代海量智能体生态勾勒出了清晰的进化路径。
) ^6 F; i6 P0 `( d% p通过将个性化数据保留在用户侧(Carrier)、将服务统一在市场侧(Store)、将安全把控在监管侧(Audit),这一蓝图有望在智能体服务成熟的过程中释放巨大的技术与商业价值。 |
|