3月19日这天,除了给大家看了最新的小米SU7外,小米一口气放出了三款大家伙。它们都是专为Agent时代准备的大模型:有专为复杂多场景打造的全模态大模型MiMo-V2-Omni、能理解音律让声音更自然的MiMo-V2-TTS,还有那个参数大得吓人的万亿级MoE基座模型MiMo-V2-Pro。这次发布让大家看到了小米向AGI时代迈进的决心。雷军还信誓旦旦地说,未来三年会在AI这块砸下至少600亿元。光是今年,在大模型、具身智能和AI应用上就要掏160亿元。 为了接住这事儿,小米在个人设备端悄悄搞了个名叫miclaw的移动端Agent产品,目前正在小米17系列这些新手机上做内测。在智能家居那边,小米去年推的Miloco方案其实就是MiMo在现实里的第一次大练兵,还给家赋予了“眼睛、大脑和手脚”。而在智能车领域,这次HAD系统升级了,它用上了MiMo-Embodied作为基座,把自动驾驶和具身机器人的认知统一到了一起,推理能力变得更强了。小米把这些核心技术牢牢抓在手里,就想把AI从虚拟的世界里拉到现实中去。 这次发布的MiMo-V2-Pro是小米的第一个万亿级参数模型,用了Attention架构,支持上百万字的长上下文,现在已经能体验了。MiMo-V2-Omni负责复杂的多模态交互和执行任务。为了把这些能力都用起来,小米正在让AI大模型往主营业务里深扎进去。至于HAD系统升级用的MiMo-Embodied架构更是个亮点,它是具身智能和自动驾驶的统一体。在这之后,公司还会在AI、机器人和芯片这些硬科技上继续下功夫。