\n

\n

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

云端模型如何落地物理世界?招商局狮子山人工智能实验室用LiOS打通具身智能全链路

从仿真到多形态真机,具身模型如何落地复杂家庭柔性物体操作?

量子位 | 公众号 QbitAI

把一件皱成一团的衣服叠好,是家务,也是机器人操作里的“硬仗”。

叠衣服,何以成为具身智能圈的“试金石”?

对人类而言,“叠衣服”是个无需思考的日常生活动作,但在机器人柔性操作领域,却是顶级难题之一。

衣物属于典型的无定型柔性物体,抓起一个角,整体结构都会随之改变。

宏观上,机器人要判断整件衣服的朝向、展开程度和折叠路径;

细节上,布料的摩擦、厚薄、弹性、静电吸附,甚至毛边、线头、标签、拉链、纽扣与夹爪或桌面的轻微挂连,都会改变一次抓取、拉平或翻折的结果。

因此,叠衣服已成为前沿具身操作模型的重要验证场景。

Physical Intelligence在π系列发布中,将laundry folding作为需要专门post-training的高灵巧任务;Dyna Robotics也把布料/衣物折叠作为真实商业场景中的第一步,强调长时间稳定运行、输出质量和错误处理能力。

叠衣服看似日常,却同时考察具身智能机器人的

柔性物体感知、双臂协同、接触控制、长程执行和状态恢复能力

它不是一项难度固定的任务,而是随初始状态、衣物类型和操作目标的变化,呈现出清晰的难度梯度:

从已经展平、边角清晰的衣物开始折叠,到面对揉皱、翻折、朝向未知、局部遮挡的任意初始状态;

从尺寸较小、结构相对简单的儿童短袖、毛巾,到尺寸更大、自由度更多的成人长裤、长袖上衣;

从简单对折,到需要先展开、整理、对齐再进行多步折叠的完整流程。

每增加一个维度,机器人需要处理的状态空间、接触不确定性和长程误差都会迅速放大。

叠衣任务就像是具身操作的一个缩影:足够贴近日常生活,又足够集中地暴露机器人在真实世界中面临的核心难题。

△任务难度随衣物拓扑复杂度、初始状态复杂程度、衣物类型多样性与物体数量的增加而提升

长期以来,行业多数方案仅能在理想仿真环境或衣物摆放规整的标准化初始状态下完成简单叠衣动作,一旦面对真实家庭场景中衣物褶皱堆叠、随机朝向、局部缠绕等复杂工况,极易出现抓取落空、折叠错位、流程中断等问题,无法实现稳定落地与规模化应用。

在此背景下,招商局狮子山人工智能实验室联合智谱具身智能部门参加了ICRA 2026官方竞赛之一的LeHome Challenge。

该赛事聚焦家庭场景中的衣物操作,在其仿真环境中使用SO101双臂将衣物从展平状态开始折叠,考察具身模型在复杂柔性物体和丰富交互形式中的理解与操作能力。

多重技术优化,探索虚实迁移破局思路

基于赛事官方训练数据和仿真环境,招商局狮子山人工智能实验室团队(以下简称“实验室团队”)将训练、部署、轨迹采样、Real2Sim遥操作串联为数据迭代管线。

官方环境通过纹理、光照与衣物初始位姿的随机化,为策略提供了多样化的视觉与物理条件。

实验室团队在轨迹采样过程中进一步引入扰动与增广,围绕抓取点偏移、展开不足、边缘未对齐、折叠错位等典型失败模式扩展状态分布,并结合Real2Sim遥操补充仿真中难以覆盖的状态,将高质量操作经验回流至仿真训练流程,帮助策略在“训练—部署—采样—增广—回流”的循环中逐步提升叠衣任务表现。

为实现高效的模型策略迭代闭环,实验室团队在训练层面引入多模态大模型训练框架中的分布式并行策略、高性能算子和多模态数据流优化方案,使训练吞吐提升5倍以上;在评测方面,对官方仿真环境进行并行化改造,提升本地评测效率

,支持评测所需的异构计算资源横向扩展。

最终,通过仿真赛阶段的策略迭代与验证进入了LeHome Challenge 2026的决赛圈。

但仿真环境的优异表现,无法直接等同于真机落地能力。当优化后的策略部署至SO101实体机器人后,虚实迁移的核心鸿沟显现。

受到打印件刚性、装配精度、夹爪稳定性与控制误差等因素影响,仿真中稳定的抓取、拉平和折叠动作,进入真机后可能表现为抓空、夹取不稳、动作偏移,导致质量下降。

再加上SO101的5 DoF本体特性,放大了真实场景的状态的多样性与随机性,更多的长尾状态成为真机验证中必须被观察和处理的困难。

具身模型进入真实物理世界进行迭代,同时也暴露模型算法、硬件本体之外的系统性问题。

仿真中得到的策略需要接入真实本体,并通过运动控制、执行约束和安全机制转化为可连续执行的真机动作;真实运行中的状态变化、动作偏移和异常情况,也需要被及时观察、记录和处理。

每一次真机执行都不再只是一次独立尝试,而是连接训练、部署、本体控制、图传观察、状态记录、人工接管和后续优化的一环。

正是在这条被拉长的运行链路中,具身智能对系统级基础设施的需求变得清晰起来。

自研LiOS架构,搭建端云协同智能基座

SO101真机叠衣背后,暴露出具身智能实践过程中的两个核心问题。

作者 gjqs