自动驾驶技术迎规模化突破 元戎启行发布L5级解决方案

问题:L5自动驾驶为何屡次延期、落地节奏不及预期 近年来,自动驾驶产业感知、规划、控制等关键能力上持续进步,车端算力与传感器成本下降也为规模部署创造条件。但更高等级自动驾驶,尤其是面向全场景、全天候的L5目标,仍多次出现“时间表后移”。在元戎启行的判断中,症结不在某单点技术,而在系统走向成熟所必需的规模化能力尚未形成:既要模型容量能够覆盖近乎无限的道路场景分布,也要具备可持续复利增长的数据闭环与工程体系,二者相互制约,决定迭代速度与上限。 原因:模型与数据“双瓶颈”共同限制进阶效率 一上,小模型对数据的吸收会出现边际收益递减,面对复杂多变的城市交通、极端天气、低频高风险“长尾场景”,模型能力容易“吃不下、学不全、泛化不足”。另一方面,传统数据生产管线高度依赖人工处理:从海量原始数据中发现问题、筛选片段、标注样本、评估效果往往周期长、成本高、难以标准化,导致数据迭代难以形成稳定复利。行业普遍认可“车队闭环”的方向,但闭环效率若无法提升,规模优势就难以转化为能力优势,最终表现为高阶能力推进缓慢。 影响:规模化能力成为产业竞争的新分水岭 随着城市NOA等功能进入规模装车阶段,产业竞争正从“能不能跑”转向“能不能持续提升、能不能稳定扩展”。规模化能力强的企业,更可能在复杂场景覆盖、系统稳定性、量产效率与合规安全论证上形成优势:其一,车队数据能够更快沉淀为训练样本与验证证据;其二,模型迭代周期缩短,有利于应对道路环境变化与版本快速演进;其三,针对安全接管、风险场景复现与验证体系化能力,将成为面向更高等级自动驾驶的重要基础。对整车厂与产业链伙伴来说,选择技术路线与合作模式时,也将更重视“模型—数据—工程闭环”的可持续能力。 对策:以基础模型为枢纽,推动模型、数据、仿真三线协同 据介绍,元戎启行提出以基础模型为核心的“模型与数据双飞轮”,并强调仿真技术在长尾场景上的补位作用。其路线的关键点包括: ——模型规模化:以400亿参数VLA基础模型为核心提升容量与泛化 该公司推出400亿参数的VLA(视觉+语言+动作)基础模型,并采用分阶段训练策略:在预训练阶段以视频预测为主要方式,利用超大规模数据提升对动态交通要素的学习效率;在中期训练中,将驾驶行为学习与语言能力结合,强调对驾驶决策的推理、分析与解释能力;在后训练阶段引入强化学习优化策略,并将实时推理延迟控制在约60至85毫秒,以满足车辆10至15Hz实时控制的工程需求。其意图在于通过更大容量与更统一的模型结构,降低多模块规则耦合带来的复杂度,逐步逼近“端到端、少规则”目标。 ——数据规模化:提升原始数据到高质量样本的转化效率 元戎启行认为,数据闭环的关键不是“有没有数据”,而是“能否高效把数据变成训练与验证资产”。为此,其提出用基础模型赋能数据全流程:对系统问题进行自动诊断,从海量数据中挖掘高价值片段,辅助标注与质量控制,并自动评估样本有效性,压缩迭代周期。其披露,传统数据生产周期往往超过5天,通过流程自动化可将周期压缩至约12小时,形成更快的迭代节奏。结合已落地车队产生的接管数据,目标是提升数据转化率与可用性,为后续扩大装车规模提供“越跑越会开”的闭环基础。 ——仿真技术:面向长尾与极端场景提升覆盖与验证能力 面向低频但高风险的边缘场景,仅依靠真实道路采集往往效率不足、成本高且存在安全风险。涉及的方案提出通过高保真三维场景重建与自动修复,缩小仿真与现实差距;利用风格迁移等方法生成全天候仿真数据;并通过在真实数据中插入三维障碍物等方式,系统化构造极端危险场景,用于训练与验证。强化学习与模型评判机制被用于检查推理与动作一致性,提升决策在边缘场景下的可靠性与可控性。 前景:从规模部署走向能力复利,L5仍需跨越系统性门槛 元戎启行披露,其城市NOA方案累计装车已超过20万辆,真实行驶里程约13亿公里,并提出向百万规模冲刺的目标。业内普遍认为,规模扩张既意味着数据与工程能力的放大,也意味着对安全、稳定、体验一致性提出更高要求。面向L5目标,要满足系统全模块数据驱动、端到端减少人工规则、车队闭环具备足够有效接管数据以及模型容量覆盖全场景等条件,仍需要在算力供给、数据合规治理、验证体系、功能安全与监管协同各上形成更成熟的产业化路径。未来一段时间,更现实的进展或体现在:统一模型带动迭代效率提升,数据闭环效率持续压缩,仿真与现实的差距深入缩小,高阶能力在可控范围内逐步扩展场景边界。

自动驾驶迈向更高等级,不只是单项技术的突破,更是规模化系统工程能力的比拼。以更强的模型、更快的数据闭环与更逼真的仿真推动能力增长,提供了一条可观察的推进路径;但越接近“无人化”,越需要以安全为底线、以合规为边界、以可验证为标准。未来,谁能在规模扩张中守住安全与责任,并形成可复制、可持续的迭代机制,谁就更可能在新一轮产业竞速中占据主动。