arl-tangram 系统,小米在ai 基础设施上的竞争力正在增强

好的,我把2024年到2025年这段时间的事儿给大家捋捋。先是2024年10月,罗福莉作为联合作者参与了小米和北大的研究,当时的成果主要围绕MoE架构和强化学习结合,这是她在小米的第一个学术里程碑。等到了2025年的伙伴大会上,她才以研究员的身份正式亮相。她在社交平台上分享过感触,说智能未来会从语言走向物理世界,自己就在Xiaomi MiMo里和大家一起冲刺AGI。 这次的新进展是罗福莉团队开发出了ARL-Tangram系统。这是个统一的资源管理工具,能把异构资源的约束条件都满足了。核心是用了统一的动作级公式加上弹性调度算法。实验数据显示挺牛的,在智能体强化学习任务中,平均ACT提升了最高4.3分,训练步骤的时间也压缩了1.5倍以上,最关键的是节省了71.2%的外部资源。 罗福莉本来是DeepSeek的研究员,现在是小米MiMo大模型团队的负责人。她现在和北大合作搞出这个成果。这个系统发布的学术论文成了小米技术积累的重要部分。她在文章里提到,ARL-Tangram不仅把效率提上去了,还给大规模AI模型的训练和部署提供了新路径。 这算是她在小米公开的第二项大成果。之前她也参与过MoE架构相关的研究。两次研究都在搞效率优化,说明小米在基础研究上挺舍得投钱的。 这个系统也体现了产学研合作的潜力。DeepSeek、MiMo、MoE这些都是团队或者架构的名字。Xiaomi嘛,就是小米咯。这技术挺硬核的,给AI资源管理领域提供了新范式。预计在2025年左右这个成果会开始发挥作用。 所以不管是从时间线还是技术内容来看,这次成果不仅证明了团队的实力,也展示了小米在AI基础设施上的竞争力正在增强。