问题——具身智能从“能做”走向“好用”的关键瓶颈哪里。近年来,具身操作模型在标准化基准上的成绩不断刷新,但产业落地更关心的是:在陌生物体、环境干扰以及不同机器人硬件条件下,模型能否不经或少经微调仍保持稳定表现。高德此次开源ABot-M0及大规模真实轨迹数据,回应了开源社区对“可复现、可训练、可部署”的基座模型需求,也把“通用性边界”该核心问题推到聚光灯下。 原因——用数据与架构统一提升可复现性。公开信息显示,ABot-M0的技术路径突出三点:其一是数据统一,将单臂、双臂、轮式机械臂等多形态机器人的操作数据,通过标准化管线对齐控制信号、关节空间信息与多模态观测,力求在同一表示空间内学习通用操作规律;其二是架构统一,采用“双流”设计,一路侧重语义理解,另一路通过可插拔3D模块提取几何特征,以兼顾指令理解与空间操作;其三是算法与工程开放,除模型与训练代码外,还提供接口封装、动作重映射等配套组件,意在打通从数据到部署的链条。相较于只公布权重或只开源数据的做法,完整工具链对科研与中小团队尤具吸引力。 影响——基准成绩提升并不等同于现实可用性突破。ABot-M0在Libero-Plus、RoboCasa等公开基准中取得较高成功率,反映出其在受控评测环境下对既定任务的学习与复现能力。需要指出的是,基准测试通常具备目标物体相对固定、光照背景稳定、动作空间受限等特征,而现实场景中存在摩擦变化、物体形变、遮挡与反遮挡、传感器噪声、执行器磨损带来的时延等不确定性。尤其是当训练数据主要来自遥操作采集时,模型更接近学习“人类控制输入与结果之间的统计对应”,并不必然形成对物理因果关系的充分刻画。换言之,在质量分布改变、接触模式未见、硬件标定差异明显等情况下能否自适应,仍有待更多公开测试与可复核证据支撑。 对策——从“开源可用”走向“跨域可靠”需系统补课。业内人士认为,推动通用具身操作模型真正走向应用,需要在三上形成合力:一是建立更贴近真实世界的评测体系,在跨光照、跨材质、跨任务链、跨硬件平台等维度增加公开可复核的对比测试,并公开失败类型统计,便于社区定位短板;二是强化数据多样性与质量控制,在遥操作之外,引入更丰富的物理交互数据、异常场景数据与安全边界数据,提升对长尾情况的覆盖;三是推动软硬件协同优化,尽管不少模型提供了部署接口,但实时控制的延迟补偿、传感器噪声建模、执行器饱和与安全约束处理等工程难题,往往决定系统能否在现场稳定运行。对使用者而言,复现性能不仅依赖模型权重,更依赖机器人本体、相机标定、遥控设备与控制频率等条件的一致性,亟须形成更明确的配置建议与迁移指引。 前景——开源将加速迭代,通用性突破仍需时间检验。总体看,ABot-M0以较大规模真实轨迹数据、较完整的开源内容与工具链,提升了具身操作研究的可复现性与工程可触达性,有望促进高校实验室、初创企业在同一技术底座上快速试验与迭代。此外,通用基座模型真正的竞争力,不仅是基准分数领先,更在于零样本条件下应对未见物体、环境扰动和机械差异的稳定性与安全性。随着开源生态扩展、更多第三方平台参与复测,模型跨域能力、迁移成本与可靠性边界将更清晰,也将倒逼数据采集、评测标准与部署规范继续完善。
开源是技术进步的重要推手,也是检验技术的试金石。通用机器人技术的发展——既需要开放共享的合作生态——更需要在真实世界中证明其适应能力和安全性能。这不仅是技术竞赛,更是对物理世界复杂性的深刻理解与突破。