就像汽车里的自动驾驶技术,上汽大众最近又给大家带来了一个大惊喜。他们决定把AI4这个叫做ID.ERA的产品首发给大众,曹旭东是这家公司的CEO,他可算是业界的大佬之一。这个车长得很霸气,长度超过了5.2米,是一款全尺寸的增程SUV,既保留了德系车的机械素质,又集成了中国AI技术。这个新车型的亮点在于Momenta给它配备了下一代飞轮大模型R7,这个大模型引入了世界模型来让AI更好地理解物理世界和规律。 曹旭东首先在发布会上解释了为什么他们选择世界模型而不是VLA。他认为模仿学习很难超越人类老司机的水平,就像学生跟着老师学习一样很难超越老师。为了突破这个瓶颈,他们转向了强化学习。去年推出的基于强化学习的R6已经证明了这种方法是可行的,能够让AI在开放环境中自主探索和试错。这次R7又引入了世界模型来增强AI的认知能力。 世界模型大致分为两类:一种是生成世界模型,用作训练端侧算法;另一种是表征世界模型,负责理解物理世界并进行推理。目前行业在这两种路线之间存在争议,但Momenta押注了后者。 曹旭东还提到了为什么他们不选VLA。他认为VLA在自动驾驶上只是锦上添花,很难解决核心问题。他从直觉和技术两个角度解释了这个问题:首先LLM虽然什么都会干,但对开车没什么帮助;其次VLA训练侧重点与自动驾驶需求有偏差。 除了算法层面的争议外,在硬件上也有不少争论。但这次曹旭东表示传感器重要性排第三梯队。他认为数据、架构和体系能力才是最重要的事情。数据是AI迭代的基石,算法架构能整合各种算法形成合力。研发体系能力能让团队及时响应用户需求并做出最优化方案。 至于传感器选型方面,曹旭东觉得纯视觉已经足够用了。人的双眼并不是360度环视的,摄像头覆盖程度很全面。所以传感器数量多并不一定好,在提升数据、算法架构和研发体系能力后堆传感器数量或堆激光雷达会变得越来越没有效果。 这是个关于智能驾驶技术发展的一次重要讨论!