小米最近公布了一个让人大跌眼镜的消息,声称“Hunter Alpha”是他们的自研大模型。紧接着,他们还放出了MiMo-V2-Pro、Omni还有TTS这三个全新的AI产品。对于这次推出的多款大模型,罗福莉透露说,这些都是专为智能体时代准备的全栈产品系列。她把这次发布比作一次悄悄进行的伏击,因为研发团队从聊天模式转向智能代理模式的速度比想象中快多了,连她们自己都没料到。 为了推动研发,罗福莉给团队下了个狠招:要求每个人在24小时内完成至少100次对话测试。虽然听着有点严苛,不过这种做法倒是激发了大家的创造力,研究进度也一下子提上去了。在开源方面,罗福莉承诺只要MiMo-V2系列稳定了就把源代码开放出来。这不仅符合小米一贯开放的技术理念,还能给开发者社区提供一个新的研究基准。 现在大家都知道了,这个叫Hunter Alpha的模型原本是在全球最大的API聚合平台OpenRouter上出现的。它凭着出色的表现把榜单第一名的位置给抢了下来,搞得好多网友都在猜它是不是DeepSeek V4的早期版本。就在大家议论纷纷的时候,小米跳出来认领了这个模型,顺便还把三款新产品给推了出来。 为了做好这个模型,研发团队提前几个月就开始训练基础模型了。他们通过引入混合注意力机制,既保持了创新性又没让技术变得太复杂。最终这个模型支持了1M上下文窗口,还通过MTP推理架构把延迟和成本控制得很低。 罗福莉特别提到,这些技术决定可不是一时兴起想出来的,而是提前布局好的战略优势。推动整个项目质变的关键节点发生在团队第一次接触复杂智能体框架的时候。那时候她觉得这简直就是“精心编排的语境”,在第一次测试里就展现出了惊人的潜力。 针对外界说的研发效率问题,罗福莉总结了四点原因:一是长期投入基础设施建设;二是有直觉驱动的迭代能力;三是保持好奇心的探索精神;四是对技术理想的全身心投入。她觉得真挚的技术热爱虽然经常被低估,但它才是突破瓶颈的关键动力。 现在这三款大模型已经上线让用户体验了,到底好不好用还要看市场的检验结果。不过对于小米来说,这次的动作肯定是想在AI领域再搏一把风头。