马斯克:自动驾驶技术要想做到真正安全,不用人工盯着,得积累差不多100亿英里的数据。

最近,特斯拉公司CEO埃隆·马斯克提到了个目标,他认为自动驾驶技术要想做到真正安全,不用人工盯着,得积累差不多100亿英里的数据。这可是个大数字,换算成公里数差不多就是160.9亿公里。这个话题让大家把眼光从那些炫酷的技术展示上移开,开始关注那些更基础但也更难啃的骨头——也就是怎么把现实世界里各种复杂的场景给数据化处理好。马斯克说的“现实世界的长尾复杂性”,其实就是指那些发生概率特别低、但是种类特别多的极端情况,比如说突然下大雨或者路上出现奇怪的障碍物。这些情况虽然不常见,但却是自动驾驶系统能不能完全放心用的关键。想解决这些问题光靠实验室模拟或者在几条路上跑跑是不行的,必须得有全球各地不同天气、不同交通习惯的海量真实数据来持续训练。 特斯拉这家公司在这点上有天然优势,他们靠着卖出去的几百万辆车子形成了一个庞大的网络,每天都在收集数据。这种模式让他们能比别的公司更快、更大规模地拿到真实驾驶数据来喂给神经网络训练。分析觉得这种数据优势就像是个护城河,让竞争对手很难一下子追上来。数据也确实能说明问题,根据统计,到2025年底,他们FSD系统已经跑了快70亿英里的路了。这个数字不仅比马斯克之前说的为了拿牌照大概需要60亿英里的数据还要多不少。 不过离100亿英里的目标还差得远呢。行业里有人也在琢磨怎么才能积累到这么大的体量。马斯克以前评价别的AI项目的时候说过,实现99%的效能相对容易,但那最后1%的“长尾”问题却特别难搞定。特斯拉AI团队的高层也认同这个说法,觉得这事儿比一般人想的要复杂多了。这其实是行业里的一个共识:自动驾驶现在的竞争重点已经不是比谁的原型做得好看了,而是看谁能拿到海量高质量的数据、谁能更快地迭代系统、谁能把工程能力做得更扎实。 这种发展也带来了很多新的问题。比如怎么在加速积累数据的同时保护隐私和安全?怎么让公众相信这些技术是负责任的?这些都是必须要一起解决的问题。未来谁能在不违规的情况下更高效地利用好这些数据去攻克“长尾”难题,谁就有可能在这场变革中拿到主动权。现在的竞赛已经进入了一个新的阶段,比拼的是数据有多深、算法有多成熟。