|
|
IT之家 2 月 17 日消息,据银河通用机器人官方微信公众号消息,马年春晚上,银河通用机器人“小盖”的一系列操作惊艳了全场:从精细地盘核桃、捡玻璃碎片、货架取物,到生活化的叠衣服、串烤肠,全都轻松拿捏,动作灵巧且自然拟人。而且,与传统机器人表演依赖预编程不同,银河通用此次展示干活技能的实现是端到端自主感知、自主决策、自主执行。1 X: ?6 d* x/ j( B) n0 \7 E
r$ ^! \" g. z( q; @1 S" k
IT之家附官方详细介绍如下:- V9 C. T. U! h7 L' Q( V1 j! N
银河通用的核心能力,源于一条迥异于传统机器人技术的大模型路径。公司自主创新并应用了一条融合超大规模虚实数据端到端训练大小脑协同具身大模型的新范式:即基于自主构建的百亿级具身智能数据集,打造的全球首个集成“大脑-小脑-神经控制”于一模的全身全手端到端大模型 ——“银河星脑 AstraBrain”。
' Q0 }+ }4 w( P- G, O今天,我们就透过这些绝活,首次官方深度解密这个全身全手、大小脑端到端协同的大模型是怎么练成的。3 d3 v, J: k$ J9 P: y$ L
绝活背后的技术突破6 d0 r, m% q: r0 v8 m
春晚舞台上,“小盖”展示的每一个干活动作都不是提前编写程序的“表演”,而是 AstraBrain 自主决策能力的实时、自主干活能力。让我们透过这些最具代表性的绝活,拆解背后的技术密码。
! J1 c: {' _4 G绝活一:盘核桃 —— AstraBrain 中的小脑赋予指尖“手感”
: W* q* o: }4 Z8 @当“小盖”将两枚核桃置于掌心,手指灵巧地搓动、翻转,这背后是灵巧操作领域的世界级难题。
# m4 o5 L; Y L8 E* _9 [
/ j |# }3 x E; S H2 H盘核桃的挑战在于:核桃表面不规则、重量分布不均,手掌握持状态下每根手指的受力点时刻变化,任何细微的力矩偏差都会导致核桃滑落。
, Y- O( ~9 ^1 D; n0 K7 {银河通用自主研发的 AstraBrain 中的灵巧手神经动力学小脑模型,正是破解这一难题的关键。想要练好灵活的盘核桃小脑,机器人需要先是在虚拟世界里打基础,让机器手在虚拟世界里疯狂练习,系统会给它喂各种大小、重量的虚拟核桃,让它靠不断试错,练出一套适应性极强的“基础盘法”。 R# r* l" r! ?% B7 x, ]
其次是在现实中加纠偏:因为电脑模拟和现实(比如真实的摩擦力、机械误差)总有差别,所以我们让真实的机器手去接触各种实物,积累真实的“物理手感”。等它真正在现实里盘核桃时,系统就会利用这种手感,在后台悄悄微调动作指令,把虚拟和现实的误差给补齐。简单来说,就是在虚拟世界练招式,在真实世界找手感,两者结合,机器手就能在现实里把核桃盘得十分溜了。0 o2 A2 n- T' K g
$ d+ t& n( u/ x4 c5 {2 T5 w# x
刚开始盘不动还总掉
# R0 Q# [8 p& [
* Y6 W4 C# r* Y# \- x& T1 g" R
逐步盘起来但还不够流畅; c, o/ V {3 T0 L! H
' h( @. o6 U8 U8 e, F- f) D# | p: _逐渐流程自然,速度也提升
H2 o& N7 {, J' P( S) [绝活二:捡玻璃碎片 ——AstraBrain 中的大脑挑战感知极限% \% n( T X5 X# h- u/ ?% y) I
在春晚舞台上,“小盖”被要求从浅色桌面上捡起散落的玻璃碎片。这是一个对人类都颇具风险的精细操作,对机器人而言更是感知与控制的双重极限。 ?& ]: t8 x+ `% w: N; ^7 @3 G
! e2 ~* Q- ]$ c8 E$ b玻璃碎片的难点在于:透明物体在视觉上近乎“隐形”,尤其是放置在浅色桌面上时,其边缘、厚度、反光特征极易与环境融为一体。传统视觉算法难以准确识别透明物体的三维轮廓和位姿,更无法判断抓取点。
3 N. E+ b; l+ ]! \& s5 I. Q" ]AstraBrain 的突破在于,通过在仿真环境中生成海量的透明物体数据 —— 不同厚度、不同碎裂形状、不同光照条件下的玻璃碎片 —— 让机器人在虚拟世界中“见过”各种可能的透明形态。结合多模态感知融合技术,“小盖”能够从微弱的反光边缘和阴影变化中“看见”玻璃的存在,并精准规划抓取策略。9 l4 a; g0 l# x5 w y& P# n! X
更关键的是,模型赋予的力觉感知让它在接触玻璃时能够感知到硬度和滑动趋势,以恰到好处的力度稳稳捏起碎片,既不会捏碎,也不会滑落。 \0 Q: ~$ I# o0 y% U. I1 E" N
这一能力,为机器人在家庭清洁、工业回收等场景中的透明物体处理打开了全新可能。3 I+ c4 N3 G- m9 J
绝活三:货架取货 ——AstraBrain 大小脑协同在动态环境中精准抓取
" Z& h- {6 ^2 M% `- z在春晚舞台上,“小盖”需要从货架上取下一瓶矿泉水。
+ ?1 ]# f, T( ]. B这看似简单的动作,实则暗藏玄机 —— 水瓶被紧密排列在货架层板之间,周围商品间距极小,稍有不慎便会碰倒邻品或抓取失败。8 H& Y8 a+ ^8 Q+ s; D
4 W* K o' Y+ I6 }5 l这要求机器人必须同时处理三重难题:一是通过大脑精准判断水瓶在货架上的位置;二是用拟人的动作伸手拿到水瓶,并过程中不能碰倒周围的商品;三是灵巧操作,水瓶上半身较细、下半身较粗,且通常被紧密卡位,直接平移取出极易卡顿。
; o9 Y0 X3 l4 ~4 mAstraBrain 的强化学习框架让“小盖”在虚拟世界中经历了亿万次“取货试错”:碰到旁边商品扣分,成功取下加分。经过这样的自我博弈,它“悟”出了一条人类都未必想到的最优路径 —— 先以灵巧的手指轻轻扣住水瓶上半身的瓶盖处,微微倾斜以避让两侧邻品,感知到阻力后顺势调整角度,再稳稳向外抽出。
7 [) R6 A- p9 V x' {+ h这一过程不是预设轨迹,而是实时决策的结果。每一次扣动、每一次倾斜、每一次抓取,都是机器人在毫秒级时间内根据当前环境做出的自主判断。
' ?% \7 R& Y u. s绝活四:叠衣服 ——AstraBrain 对柔性物体的泛化灵巧操作8 Q$ _8 M4 }! j% `
叠衣服被认为是机器人操作领域的最大的命题之一:因为衣服是柔性的,没有固定形状,每一次拿起来的状态都完全不同。
3 f# S2 c' E3 [5 j" ]3 N, U) F春晚现场,“小盖”面对的是随机摆放的 T 恤,没有预设的折叠轨迹,没有固定的抓取点。它需要实时判断布料当前的褶皱状态,预测折叠后的形态,并规划出一系列抓、拉、折、压的动作序列。! d$ Z9 |& W, {2 |3 p0 f Q* [. q* J
% ~+ K) i, x/ Y, C* G, K
AstraBrain 的解决方案是:在仿真环境中生成数以万计的柔性物体变形数据,让机器人在虚拟世界中“见过”各种可能的褶皱形态,并学会从当前状态推演出最优操作路径。当“小盖”的手指轻轻抚平衣角、精准对折时,它不是在执行程序,而是在调用海量仿真经验基础上的实时决策 —— 这正是“举一反三”能力的终极体现。
4 Y+ {3 W1 U. g4 @6 ]8 I* Z绝活五:串烤肠 —— 双手协作与工具使用的双重突破
; [( _! F! Q/ R( ]5 C" G- s' J如果说盘核桃考验的是单手的灵巧,那么烤肠则是对双手协同与工具操作能力的极限挑战。
/ I F& U" \) O: |+ {! F7 `4 w在春晚舞台上,“小盖”需要一手操控烤钳进行烤制,另一只手抓取签子,双手协作、精准完成串烤肠,并递给明星 —— 整个动作丝滑如水,这背后涉及双手的空间协同、力度的独立控制,以及对工具这一“身体延伸”的理解。
8 T' w7 i$ H G7 V' k
+ A7 | Q+ j4 ^( v* B5 I6 ]0 NAstraBrain 的端到端大模型架构,让机器人的“大脑”能够同时处理双手的独立指令流,并在执行过程中实时调整。更关键的是,通过对海量仿真数据的学习,“小盖”理解了“工具”的本质:烤钳不是需要被控制的“物体”,而是手的延伸,是完成任务的媒介。这种对工具操作的泛化能力,让它能够像人类一样,拿到任何新工具都能快速上手。
/ _+ G8 H4 N" M9 l" ]在以上所有的干活任务中,细心的观众可能还发现了,小盖机器人干起活来的举手投足比其他机器人都更像真人,透着一股亲切感。5 A& @% z8 b+ }! D7 C8 V2 a
这背后全靠“银河星脑 AstraBrain”对人类动作数据的大规模仿真生成机制。. S) c& |( ]' F& p( ^
为什么要死磕人类数据仿真生成”?因为相比去一点点采集机器人的生硬动作,我们人类每天的生活动作不仅海量,而且获取起来极其容易。把这种最丰富、最易得的人类数据结合仿真生成,能够把人类的动作先验利用到极致,正是当前通往机器人大模型技术突破最可能的方向。
9 r. _ z, o, s( @/ E% a银河星脑 AstraBrain :拒绝“死记硬背”,掌握“举一反三”
3 a) K2 R: a7 q7 L/ f4 z: h透过上述绝活,我们可以清晰地看到 AstraBrain 的核心哲学:拒绝对特定动作的机械设定,而是让机器人掌握一套可以泛化到新场景、新任务的通用能力。 @3 X# V8 K u' V7 g# L# {
4 x- _! t( U1 ]1 E图: AstraBrain 银河星脑技术框架
3 w; l5 j) v* B. {0 [* S我们就以“小盖”应用最广泛的“货架取物”为例,拆解它经历了哪几个步骤的修炼:3 z! _4 C8 o6 R0 h) A( f
第一步:人类少样本示范& g7 H0 v: A) y$ \- r
过去教机器人一个新技能,往往需要遥操作手把手地教成千上万遍。! h7 S" z9 }2 I$ y5 m* m
AstraBrain 彻底改变了这一模式。) `* g2 t h) I% H5 B
它仅需少量人类示范,机器人便能理解任务的核心意图,将这些动作“记住”,并在自身硬件上等效地展示出来。这是“小盖”快速适应春晚舞台复杂光线、多变道具摆放的基础。
& ^# f2 ]$ t" C( W
* ?' G& ^1 D6 c第二步:仿真数据合成
2 |8 |) Q& @' R, g0 d: x现实中学习效率太低、数据成本太高。
3 w" W$ s' P3 f3 rAstraBrain 的第二招,是把机器人扔进一个“虚拟世界”—— 高精度物理真实的仿真环境。" Z' i% T6 M) |6 }; E9 {
在这里,系统可以自动生成数万种不同的场景:货架摆法随机变化、光照条件任意切换,并通过生成式模型批量产出拟人化的抓取动作。机器人通过在海量仿真数据中模仿学习,掌握了应对各种复杂情况的操作精髓。
0 a- S& b/ b: ^+ I7 g& M. l
; g! o( v, U9 v' q, p6 f' u* `第三步:强化学习闭环9 w; G4 z5 E' z
仅有模仿,还不足以支撑极致的精细化操作和动态避障。
! L/ _& ?$ J! F3 ^' O( r% [为此,AstraBrain 引入强化学习机制,让机器人的末端执行器在虚拟世界中进行高强度的“自我博弈”:碰到旁边的商品就扣分,完美避障顺利取出就加分。经过亿万次这样的试错迭代,机器人自己“悟”出了一条连人类示范都未必能给出的最优路径 —— 这就练就了春晚上那种“举重若轻”的丝滑手感。# S8 q9 ]4 A/ b. G9 g7 n
+ n- F4 b8 a3 u" K, H/ L9 H2 T
第四步:真实世界再“见习” `, c5 j8 e! j! j( g
虚拟世界训练得再好,回到物理现实也难免存在误差。AstraBrain 修炼的最后一步,就是让机器人在真实环境中进行少量实际操作,收集这些真机数据进行“微调”。这一步看似简单,却是彻底打通虚拟与现实隔阂的关键一跃。$ y4 G% w& n1 t p
8 S' Q! D1 g+ g9 v* }2 P
数据金字塔:从基石到塔尖的修炼逻辑* C, \+ N3 ]6 k
上述四步完成的基石,是银河通用技术体系中虚实融合的数据基建 —— “银河星坊”(AstraSynth),其具体包括以下基层:0 U& w. i) p" n# ~6 v+ G
基石层(人类数据):为机器人构建通用的任务认知,让“小盖”理解“什么是盘核桃”“什么是抓取”。
& J' z5 x8 v$ y5 W中间层(仿真合成数据):通过海量、低成本、多样化的虚拟数据,让机器人在仿真中遍历各种可能性,从而跨越虚实鸿沟。8 T: t2 p( U0 h: ]/ B
塔尖层(真机实战数据):在虚拟训练成熟后,用极少量但高质量的真实世界操作数据,完成实战场景下的最后打磨。( Z. c7 M, `4 X1 A0 R
6 [+ O5 e& z4 E7 }& ?. N: G) o银河星坊 AstraSynth 数据金字塔" O0 ~ y7 l4 ~$ o/ ^7 t+ o
用虚拟仿真解决数据不够的难题,用强化学习解决动作不准的瓶颈—— 这就是银河通用机器人的通关秘籍。
L" o; Q: G' \. a这套逻辑不仅能用来抓取货架上的商品,同样能用来盘核桃、叠衣服、烤肠。正如春晚舞台上“小盖”展现的那样,它并不是学会了某一个孤立动作,而是真正掌握了一种可以快速学习任何新技能的通用能力。 |
|