openai 推出gpt-5.4 mini和nano的轻量化模型

OpenAI最近推出了两款叫GPT-5.4 mini和nano的轻量化模型,主要是想给大家降低用AI的成本。大家对这件事挺关注的,毕竟现在大家都想要那种既高效又便宜的解决方案。现在AI发展那么快,特别是自动干活的任务越来越多,怎么控制好调用的钱袋子成了大家都头疼的事。比如处理客户邮件,要是用顶级的大模型来理解意思再一封一封发,光是计算资源消耗就很大。像之前的GPT-5.4,一次任务的token费可能比挣的还多。所以,大家都在想办法在不影响表现的情况下少花钱。这次的新模型就是为了解决这个问题。它们既保留了GPT-5.4的优点,速度和资源消耗也比以前好很多。特别是那个nano版本,是给那些特别在意速度和成本的任务用的。它的输入只要0.2美元一百万个token,大概是旗舰版的8%;输出只要1.25美元一百万个token,大概是旗舰版的1/12。mini版呢,也不贵,输入0.75美元一百万个token,输出4.5美元一百万个token,表现跟那个最强版本差不多,让用户用起来门槛更低。这种定价特别适合那种需要频繁操作的场景。 OpenClaw这种agent框架用得越来越多,AI干活的模式也变了,不再是“猛冲”一次,而是变成一步一步细琢磨。在这种情况下,大家对轻量化模型的需求越来越大。看最近的OpenRouter榜单,轻量化模型占了六个席位。有个叫MiniMaxM2.5的特别火,一个月用了8.29万亿个tokens,增长了476%。HuggingFaceHub那边的数据也显示,92.48%的下载量都是那些参数不到10亿的小模型,说明大家在实际干活时更喜欢轻便的方案。 ChatGPT现在全球每周都有9亿人在用,但真正掏钱的人也就5%左右。大家用得最多的其实就是日常聊天、改改文章这些简单的事情。这些需求不需要顶级的大模型去拼命计算,百亿级的小模型就够用了,反应速度还快。这样既提升了体验又能让人愿意付费。 实测下来这两款模型表现也不错。在那个程序员测试里(SWE-benchPro),mini版准确率到了54.4%,快追上旗舰版的57.7%了;nano版虽然低一点到了52.4%,但省钱啊,当个代码检查助手正好。 操作电脑的那个测试(OSWorld-Verified)里,mini版72.1%的准确率接近旗舰版的75%,能很准地认出界面上的东西;而nano版在复杂界面操作上还有待提高,只有39.0%的准确率。 这就像打仗一样,大模型是负责出谋划策的统帅,mini和nano就是执行具体任务的精锐部队。这种分工能让系统跑得更顺、花钱更少。 总结来说,OpenAI搞这个不光是为了跟上潮流,更是推动整个行业变得更便宜好用。市场对轻量化的需求越来越大,这两款模型很可能会变成AI应用的新基础,帮更多公司变成智能公司。