梁文锋这人身上贴着两个标签,一个叫疯子,一个叫奇才。要弄懂他到底算哪一个,得看你从哪个角度去看。在外人眼里,他活得像是个不顾一切的疯子。他砸下重金给自己买了上万张英伟达芯片,还专门招聘那些没什么工作经验的新人来干大事。更让人看不懂的是,他直接把自家的核心技术免费分享出去。但在技术圈里,大家又觉得他是百年一遇的奇才。只用557万美元就把那个号称通用大模型的DeepSeek跑通了,把推理成本压低到每百万token只要1美元,所以外媒都管他叫“AI界拼多多”。这种既疯狂又聪明的样子,让他在2025年的科技圈里火得一塌糊涂。 到了2025年春节,DeepSeek界面里那只蓝色海豚把全网都萌翻了。大家只当它是个聊天工具,其实背后藏着一场由中国人发起的技术革命。当时全球都在疯抢GPU搞算力军备竞赛,大家都以为人工智能就是比拼谁堆的芯片多。梁文锋却用数据拆穿了这个迷思:DeepSeek-V3训练只要花557.6万美元,还不到GPT-4o的十分之一;推理成本更是降到了每百万token 1美元,只有GPT-4 Turbo的七十分之一。这就是典型的低成本搞出高性能。他说这是技术进步带来的成本重构,不是补贴。到了年底,《自然》杂志把他列进了年度十大科学人物名单,给他扣了个“科技颠覆者”的高帽子。 光鲜的数据背后藏着真正的“疯”。他不喜欢用经验老到的老手,反而招了一帮应届生、博士实习生来搞创新架构。“经验有时会成为包袱。”他觉得基础能力和创造力比经历更重要。他甚至让实习生去主导开发工作。梁文锋不按套路出牌的地方还不止这些。当记者问他基础研究怎么挣钱时,他说得很理想主义:“如果非要找商业理由,可能找不到。”他本来靠量化交易赚了大钱可以安享晚年,却把钱反哺给了AI研究;大环境这么冷的时候他还囤了上万张芯片。 他最让人惊讶的是开源精神。在技术封锁这么严重的时候,他把DeepSeek-R1的训练技术全部公开了,论文细节一点没藏。“中国不能老是做搭便车的人。”他想让更多人站到技术前沿去。 正因为他这种“疯”,他才能用低成本做出高性能的产品;也因为这种“疯”,他敢于挑战全球巨头。表面上看他挺文静的,骨子里其实是个颠覆规则的革命者。他提醒大家:“所有套路都是上一代的产物。”未来不一定成立。这就是这个时代最稀缺的“奇才”特质。