谷歌这次放出来的NanoBanana2,真的是个大动作,直接把AI的生图技术推上了一个新台阶。 这回谷歌不光发布了新模型,还给它配上了Gemini平台,用户只要点进Fast模式就能用。这个NanoBanana2的底层技术是Gemini3.1Flash,内部代号叫Gemini3.1FlashImage。 对比之前的老产品,NanoBanana2最大的变化就是从单纯地模仿像素,变成了能理解画面里的逻辑。它甚至能处理物体遮挡、光的折射这些物理问题,不再像以前那样动不动就生成一些让人看不懂的“灵异”图像。 这次更新的核心突破主要有四点。首先是加入了像Gemini3.1那样的推理能力。这意味着它能在生成像素之前先分析场景逻辑,比如怎么判断光线、重力感这些。 第二个亮点是文字和图表的效果特别好。你给它文本就能出清晰的招牌和海报,做信息图表、UI界面原型图甚至是带数学符号的图解也都没问题。这让它在教育和商业领域用起来非常方便。 第三个改进是角色和风格变得特别一致。给它一张照片就能在各种动作下保持同一个人的样子,准确率据说能达到95%以上。而且它还支持上传14张参考图来做融合,画面自然就丰富多了。 最后就是视频和图片编辑功能也升级到了专业级水准。它不仅能对话式微调,还能局部精准修改,原生输出的分辨率直接冲到了2K到4K。 跟第一代比起来,NanoBanana2在架构、分辨率、文字能力和逻辑理解上都有大飞跃。架构从Gemini2.5Flash升级成了Gemini3.1Flash/Pro,分辨率从1K变成了2K/4K,文字从乱码变成了多国语言精准渲染,逻辑从机械执行变成了有“思维链”和物理常识的理解。 总之这次发布就像是AI生图技术的一个里程碑。强大的生成能力加上逻辑理解能力,肯定能给用户带来更丰富的创作体验。未来随着技术不断优化升级,NanoBanana2肯定能在教育、商业这些领域发挥更大的作用。