具身智能这方面的比拼,现在转到了“大脑”这个新赛场上。我们国家的企业,把物理世界基础模型的关键技术给攻克了。现在的人工智能浪潮,不光是在数字空间里打转,更是向着那个更加广阔、也更复杂的现实世界涌过去。具身智能就是要让机器实体有能力去感知、理解还有交互物理环境,这已经成为全球科技和产业的新高地。行业里大家都看得越来越清楚了:机器人的身体运动能力现在是进步挺大了,可要是想解锁它的广泛应用价值,给它配上一个最强大脑就成了关键的一步。这个大脑的本质,是和文本、图像这些虚拟世界的模型完全不同的物理世界基础模型。它的主要任务是突破专用系统的局限,追求泛化性和通用性。这样机器人就能把视觉、触觉、语音这些信息综合处理,直接生成动作、决策还有交互语言。 最近,变量机器人宣布完成了10亿元的A++轮融资,字节跳动、红杉中国、深创投这些顶级投资方都出手了。这次投资是深创投AI基金成立后的第一个动作,而变量也成了国内唯一一个同时拿到字节跳动、阿里巴巴、美团三家互联网大厂投资的具身智能公司。有这么多领域的资本联手支持,说明市场对这个战略重要性认可得很,也能看出来大家对这些企业技术路线和发展前景的判断。 变量机器人是2023年底才成立的新公司。虽然年轻,但它把最难的完全端到端自主研发这条路给走了,就想弄出一个通用具身智能大模型。他们核心的成果WALL-A架构,把视觉-语言-动作模型和世界模型给深度融合起来了。这个架构能预测时空状态,理解环境反馈还能内化物理常识。这样一来,机器人在陌生环境里执行任务的零样本泛化能力就大大提高了。更重要的是他们弄了一个“物理世界基础模型-真机自主进化”的闭环。模型不光在实验室里练,还通过大量真机强化学习去获取数据、优化策略。 数据是进化的动力源。变量从一开始就把数据采集设备研发出来了,还弄了一条以模型驱动为主的数据管线。这样就能生产出高质量的训练数据。技术得落地才能算成功。目前基于变量的系统在应对复杂现实时表现挺强的。比如在送外卖时遇到大风干扰或者捡箱子视线被挡住的时候,机器能“脑补”环境全貌还能自己纠错。在物流分拣这种复杂场景里它能识别形状各异的包裹还能调整动作节拍。甚至模型还解锁了高自由度灵巧手的精细操作潜力。 从实验室到真实场景这路还挺长的。变量机器人在物理世界基础模型上的探索标志着我们国家在人工智能和实体经济融合上的进步。这种完全端到端的技术思路还有模型-真机的进化理念给行业提供了参考。国家一直支持新质生产力还有前沿科技发展。随着支持力度加大具身智能这种关键使能技术肯定会在更多实际场景中落地生根推动产业智能化升级贡献力量。