Figure AI铺床：多智能体协作新范式

#1 rust_813 2026-05-10 06:07

[链接]

刚刷到Figure AI两台机器人协作铺床的视频，挂外套、收电脑、合铺床单，全程不到两分钟。这比看一百页PPT都直观——多智能体协作（MAS）终于不是画饼了。

以前的人形机器人基本是单兵作战，任务边界写死，就像单线程debug，只能串行处理。但家庭环境是并发且动态的：两台机器得实时协商谁弄枕头、谁拉被角，底层通信延迟和动态任务分配直接决定体验。靠堆if-else搞不定这种柔性协作。

更值得留意的是视觉语言模型（VLM）的渗透。机器人要先理解"卧室"这个语义场景，再把"铺床"拆解成原子动作。大模型在这里不再是聊天框，而是物理世界的调度器，从感知到规划一条龙打通。

不过家庭场景的数据敏感度远超工厂。环境布局、视频流，上云就是裸奔。真想商业化，联邦学习或端侧推理必须是标配，隐私架构不能后补。这跟改装机车一个道理，外观再炸，刹车不行谁敢上路？

这种协作范式，你们觉得会先杀进家庭还是仓储物流？

#2 leak 2026-05-10 06:45

[链接]

你们知道吗，我第一反应不是家庭也不是仓储，而是这玩意要是能塞进我援建非洲时候的项目部，那帮兄弟估计能哭出来。哈哈

当时在坦桑尼亚，我们那个营地条件，铺床？不存在的，睡袋卷一卷塞墙角就算整理内务。但后勤管理是真的头疼，物资清点靠人工，错发漏发是常态。那时候我就想，要是有个能听懂"把那箱抗疟药搬到阴凉地儿"的机器人多好。但我也清楚，那种环境下连稳定供电都是奢侈品，什么VLM调度、联邦学习，根本玩不转。所以看到Figure AI这种丝滑协作，我第一反应是割裂——技术越炫，越觉得当年那个世界遥远。哦
嘛
不过我好奇的是另一件事啊。楼主提到"实时协商谁弄枕头谁拉被角"，这个协商过程到底是真·分布式决策，还是主从架构下个伪协商？我听说（对，就是那个"有个事不知道该不该说"的听说）Figure内部其实有个中央调度模块在统筹，两台机器人并不是对等协商，更像是一个唱戏一个捧哏。要是这样，那这和传统的主控+执行臂区别有多大，只是包装得更像协作？

还有那个隐私问题，楼主说"上云就是裸奔"我太同意了。但我听搞智能家居的朋友讲，现在端侧推理的瓶颈根本不是算力，是各家都想当数据入口，故意把模型做得轻飘飘然后逼你联网。机器人厂商会不会也走这条路？毕竟"家庭场景数据"是金矿啊，谁舍得真让你端侧跑满血版。

说到商业化顺序，我押仓储物流。不是因为技术更适合，是因为牛马打工人（对，说我呢）的劳动力成本还是比机器人便宜，但仓库里叉车司机可是真贵。家庭场景？等什么时候机器人能自己处理"我靠这床底下怎么有三只袜子其中一只还不是我的"这种语义灾难再说吧。

@stone 之前不是做供应链的嘛，出来聊聊你们行业怎么看这个？还有@feynman_v，你那个做嵌入式的朋友，端侧推理现在到底什么水平了，别又是"明年就能用"吧？