他用数据拆穿了这个迷思：deepseek-v3 训练只要花557.6 万美元，还不到gpt-4o

梁文锋这人身上贴着两个标签，一个叫疯子，一个叫奇才。要弄懂他到底算哪一个，得看你从哪个角度去看。在外人眼里，他活得像是个不顾一切的疯子。他砸下重金给自己买了上万张英伟达芯片，还专门招聘那些没什么工作经验的新人来干大事。更让人看不懂的是，他直接把自家的核心技术免费分享出去。但在技术圈里，大家又觉得他是百年一遇的奇才。只用557万美元就把那个号称通用大模型的DeepSeek跑通了，把推理成本压低到每百万token只要1美元，所以外媒都管他叫“AI界拼多多”。这种既疯狂又聪明的样子，让他在2025年的科技圈里火得一塌糊涂。到了2025年春节，DeepSeek界面里那只蓝色海豚把全网都萌翻了。大家只当它是个聊天工具，其实背后藏着一场由中国人发起的技术革命。当时全球都在疯抢GPU搞算力军备竞赛，大家都以为人工智能就是比拼谁堆的芯片多。梁文锋却用数据拆穿了这个迷思：DeepSeek-V3训练只要花557.6万美元，还不到GPT-4o的十分之一；推理成本更是降到了每百万token 1美元，只有GPT-4 Turbo的七十分之一。这就是典型的低成本搞出高性能。他说这是技术进步带来的成本重构，不是补贴。到了年底，《自然》杂志把他列进了年度十大科学人物名单，给他扣了个“科技颠覆者”的高帽子。光鲜的数据背后藏着真正的“疯”。他不喜欢用经验老到的老手，反而招了一帮应届生、博士实习生来搞创新架构。“经验有时会成为包袱。”他觉得基础能力和创造力比经历更重要。他甚至让实习生去主导开发工作。梁文锋不按套路出牌的地方还不止这些。当记者问他基础研究怎么挣钱时，他说得很理想主义：“如果非要找商业理由，可能找不到。”他本来靠量化交易赚了大钱可以安享晚年，却把钱反哺给了AI研究；大环境这么冷的时候他还囤了上万张芯片。他最让人惊讶的是开源精神。在技术封锁这么严重的时候，他把DeepSeek-R1的训练技术全部公开了，论文细节一点没藏。“中国不能老是做搭便车的人。”他想让更多人站到技术前沿去。正因为他这种“疯”，他才能用低成本做出高性能的产品；也因为这种“疯”，他敢于挑战全球巨头。表面上看他挺文静的，骨子里其实是个颠覆规则的革命者。他提醒大家：“所有套路都是上一代的产物。”未来不一定成立。这就是这个时代最稀缺的“奇才”特质。