要说2026年2月,小米开源了那个叫Xiaomi-Robotics-0的大家伙,这事儿其实很有来头。它的参数高达47亿,用到了DiT和MoT这种独特的混合架构,在CALVIN、LIBERO这些测试里都打出了不错的成绩,还能在消费级显卡上做到80ms低延迟推理。哪怕是拿这玩意儿去给机器人装零件,也能做到成功率高达90.2%。 小米这波操作挺务实,既不给自己加什么高科技的光环,也不搞那些没实际意义的花架子。他们直接把机器拉进了汽车一体化压铸的车间,让它在3小时的实习里干活。那个工位的任务是往地板上拧自攻螺母,机器人得从自动送钉机上准确抓起螺母,放到定位工装上,然后还得配合后面的工序把螺母拧紧。整个过程双臂得配合着来,还得赶在76秒的生产节拍里把左右两边的螺母都搞定。 要说最难的地方在哪儿?就在自攻螺母那。那种花键结构每次抓起来的姿势都不一样,定位销轴上还有磁吸力在拉扯,稍微一个不慎就会装歪了。这种真实场景里的意外情况要是全都靠“规则编程”去穷举,根本搞不定。所以小米给机器人安排了“自主学习”这门课。 他们的核心思路是在Xiaomi-Robotics-0这个通用基座模型上做文章。这个模型通过统一的动作空间设计和跨本体的数据预训练,让机器人学会了怎么理解任务和感知空间。光有预训练还不够,还得靠“VLA RL(强化学习)”来做联合训练。简单说就是VLA给机器人提供了“常识”,强化学习就让机器人在真刀真枪的环境里试错学习。 全身运动控制这边也用了类似的混合架构。一个优化控制器能以亚毫秒级的速度处理平衡和安全这类优先级问题,另一个在仿真里摔打了数亿次的强化学习控制器负责应对极端干扰。 除了这个工位外,像搬料箱、贴前徽标这种活儿也正在验证中。这些新任务会对机器人的移动能力和手脚配合提出新挑战。回头看小米的机器人之路,可以追溯到2021年发布的CyberDog“铁蛋”和2022年亮相的CyberOne“铁大”。 那个身高177cm、体重52kg的“铁大”,搭载了Mi-Sense视觉空间系统和自研的仿生感知认知技术。它能感知人的情绪、双足平衡走路,最大扭矩达到了300N·m。虽然当初是给家里用的医疗护理场景做准备的,但那些关节控制和动力输出的技术,后来都成了工业应用的基石。 现在的关键是有了2026年2月开源的大模型支撑。为了对付精细操作的问题,团队还开发了个叫TacRefineNet的纯触觉驱动模型。这东西不用眼睛看,光凭指尖的高精度触觉阵列就能做到毫米级的位姿调整。 这套“Xiaomi-Robotics-0(大脑) TacRefineNet(小脑) CyberOne(身体)”的组合拳就是他们的底气。在组织层面上,小米已经把机器人业务合并到了北京小米机器人技术有限公司,总部也搬进了亦庄的小米汽车工厂。公司计划五年内投下20亿元来加速技术落地。雷军在电话会议里也说了:“未来5年,会有大批量人形机器人进入小米工厂干活。” 对于整个行业来说,这种从车间里实打实跑出来的数据比演示好看多了。它清晰地划出了从理论到现实的一条路,也让人看到了人形机器人从“能用”变成“好用”的可能性。