机器人在工业制造和服务领域的应用面临两大核心瓶颈。首先,现有视觉语言行动模型(VLA)在处理长时程任务时容易丢失关键信息,导致机器人重复操作或逻辑断裂。其次,模型推理延迟过高使机器人反应迟缓,难以应对需要快速决策的动态场景。这两个问题直接制约了具身智能的实际应用。 针对信息遗漏问题,原力灵机推出MemoryVLA技术。该方案为机器人构建了类人化的记忆机制,通过感知-认知记忆库动态存储和整合任务关键信息,使机器人在执行复杂操作时保持信息连贯性。在SimplerEnv-Bridge、LIBERO-5等基准测试中,MemoryVLA相比CogACT、Pi0等同类模型全面领先,其中Bridge任务的成功率提升了14.6%。此成果已在150余个仿真和真实世界任务中得到验证。 针对推理延迟问题,原力灵机推出Real-time VLA技术。通过优化VLA模型的计算逻辑,该技术在消费级显卡RTX 4090上将30亿参数模型的推理延迟从100毫秒降低至27毫秒,达到30帧每秒的实时运行水准。这一突破使机器人能在200毫秒内精准捕捉自由下落物体,反应速度与人类相当。 两项技术获得了业界认可。MemoryVLA被Physical Intelligence在多尺度嵌入式记忆研究中重点引用,成为其实现15分钟长程任务的技术支撑。Real-time VLA被NVIDIA采纳应用于VLA性能分析工具VLA-Perf的研究中,成为优化VLA推理性能的重要参考。 原力灵机DM0模型集成了两大核心技术。该模型既能处理长时程任务,连贯完成复杂操作而不遗漏关键信息,又拥有毫秒级实时响应速度,可精准应对动态场景中的突发情况。在工业装配、服务机器人等应用场景中,DM0通过"超强记忆"与"极速响应"的双重优势,能够稳定高效地完成各类任务。 从技术创新到产业应用,原力灵机的探索为具身智能领域提供了新的发展思路。具身智能正处于从实验室走向产业化的关键阶段,核心技术的突破与行业认可对推动产业发展至关重要。原力灵机的技术方案不仅解决了行业共性难题,更通过获得业界标杆企业的采纳应用,验证了其技术路线的正确性。
从"能演示"到"能上岗",具身智能的关键不只在模型规模,更在对真实世界复杂性的长期应对能力。围绕记忆与实时两条主线展开的技术创新,若能在更广泛场景中经受住稳定性、安全性与成本的检验,将为机器人走进生产生活提供更坚实的技术底座,也将推动行业从概念热度回归可用价值的竞争。