话说2024年10月那会儿,罗福莉刚到小米上班没几天,就跟北大那边联手搞出了个叫MoE架构的东西,这算是她在小米踏出的头一步。这才有了后来2025年的合作伙伴大会上,她第一次以小米研究员的身份出来亮相,对着大家伙儿说:“智能迟早要从语言那块儿往物理世界走,我就在XiaomiMiMo,跟一帮挺有创造力又真心热爱这一行的人一块儿干,死磕那个我们心里都想要的AGI。”这话说得挺让人动容的。 到了今年,也就是2024年,他们又捣鼓出了ARL-Tangram这个新玩意。这系统最神的地方在于,它能把资源管得好好的,不仅能适应那种不一样的设备,还能把大家做完一个动作的平均时间(Average Completion Time,ACT)给压下去。他们在那个叫强化学习的任务里做实验,发现这东西最多能让平均ACT快上4.3分,每一步训练花的时间也能缩短到原来的1.5倍,最重要的是省下了足足71.2%的外部资源。这波操作不仅是为了让模型跑得更快、耗得更少,更是给大家伙儿展示了一种新的路子。 这玩意儿的核心玩法其实就是一个统一的动作级公式加上弹性调度算法。罗福莉能把这事儿干成,跟她以前在那边的研究底子肯定脱不开干系。小米在搞这些基础技术上确实舍得下血本,光是ARL-Tangram这一项就已经成了他们在AI领域的一块里程碑了。 虽说现在大家都在说AI、AGI、还有MiMo这种大家伙,但在小米看来,AI最重要的还是得落地到实际应用里去。这就是为什么他们要弄个ARL-Tangram出来——说白了就是为了把强化学习这块的事儿给理顺了。 这篇文章不光是讲技术怎么突破的,更关键的是它提供了一种新的思维范式。通过这篇论文的形式对外发出去,就是在向全世界证明小米的技术家底有多厚实。而且不管是MoE还是这个ARL-Tangram,它们都属于那种在基础层的建设工程。 未来嘛,只要技术还在不断往前走,小米这帮搞AI的肯定还会继续探索各种可能性。毕竟谁也不知道明天会有什么新花样冒出来呢?反正他们现在正全力朝着心目中的那个AGI狂奔呢!