google弄了个gemini 3.1 flash-lite,性能那是蹭蹭往上涨,但要命的是用起来得比之前

咱们说Google最近弄了个Gemini 3.1 Flash-Lite,性能那是蹭蹭往上涨,但要命的是用起来得比之前贵3倍。这玩意是现在Gemini 3里跑最快、花钱最实惠的一个预览版。 你看Artificial Analysis给出的分儿数,智能指数有34分,比老版Gemini 2.5 Flash-Lite涨了整整12分。虽说能力强了不少,它处理东西的速度也没落下,一秒钟能给你推出来超过360个Token,平均也就花个5.1秒让你等。 它还特别会理解多模态数据,在Arena.ai那个排行榜里拿了1432分,搞推理和多模态这块,比其他同级别的选手都强。去参加科学知识测试GPQA Diamond,它得了86.9%;在多模态理解跟推理测试MMMU Pro里也有76.8%,这成绩甚至干过了上一代的Gemini 2.5 Flash大模型。 最爽的是它给出第一个Token的速度比以前快了2.5倍,整体干活的速度提升了45%。不过就是花的钱变多了。现在每处理100万的输入Token要0.25美元,这就比以前的0.10美元翻了3倍多;更狠的是每输出100万Token得1.50美元,这把以前的0.40美元直接给挤到了身后。 开发者还能自己调调模型的思考深度,简单活儿像翻译能应付,复杂活儿像做个用户界面也没问题。它还能一次性处理100万个Token那么长的上下文窗口,干多语言问答或者代码生成的时候都挺顺手。 Google说了,这款现在已经在Google AI Studio还有Vertex AI开放测试了,想试试的赶紧去试吧。