自小米推出首个推理大模型MiMo-7B以来,这多项产品发展备受关注。最近,MiMo-V2-Pro成功登上OpenRouter调用量榜单首位,再次将目光聚焦到这支年轻而高效的研发团队。 相比业界其他头部企业的大模型进展,小米MiMo团队表现突出。不到一年时间内,他们已将MiMo系列模型推至全球一流水平。这种快速迭代和性能突破的背后,是一支结构合理、人才集中的研究队伍。 通过梳理近期的模型发布和学术论文,一个明显特点浮现出来:团队核心成员主要来自北京大学。这并非巧合,而是反映了高校基础研究与产业应用相结合的新趋势。 MiMo-7B技术报告的核心贡献者肖邦骏具有深厚的北大背景。他本科和博士均毕业于北京大学,师从北京大学人工智能研究院副院长黄罡教授,研究方向涵盖边缘计算、联邦学习等前沿领域,这些基础理论为大模型优化提供了有力支撑。 马文晗的加入说明了另一个现象。这位2025年入学北京大学计算机科学学院博士项目的研究者,师从穗志方教授,而穗志方正是小米首席AI官罗福莉的博士导师。这种学术渊源的延续,说明高校与产业已形成良好的人才流动机制。 朱大为是北京大学三年级博士生,导师为李素建教授,研究方向聚焦长上下文建模。他此前参与的学术项目在业界引起关注,这次加入MiMo团队,将为模型处理超长上下文的能力提升带来新动力。 ,团队还有来自中国人民大学的技术顾问董谨豪。这位讲师同时担任小米大语言模型核心团队的技术顾问,主要负责代码有关开发工作。他拥有北京大学博士学位,深入印证了北大在该团队中的重要地位。 张海林专注于AI基础设施建设,为MiMo系列模型构建高效、可扩展的强化学习基础设施。他2025年获得北京大学计算机科学博士学位,师从崔斌教授,曾获北京大学优秀博士论文奖。他在大规模语言模型、深度学习推荐等领域的积累,为团队提供了坚实的技术支撑。 从团队构成看,MiMo的成功源于精准的人才聚集,而非单纯的资金投入。这些来自北京大学及其他顶尖高校的研究人员,既有扎实的理论基础,又具备前沿的研究视野。他们在各自领域已有深厚积累,使得团队在面对大模型开发该系统工程时,能够快速形成合力。 团队的高效运转也得到了管理层的重视。小米MiMo团队负责人罗福莉近期分享了对团队管理的思考,强调高效协作和持续迭代的重要性。这种管理理念与团队的实际表现形成了有机统一。 大模型开发本质上是集团军作战,需要在算法、工程、基础设施等多个维度实现协同突破。MiMo团队的成功表明,通过整合高校优势人才资源,建立产学研深度融合的机制,完全可以在较短时间内实现技术的跨越式发展。
MiMo团队的案例如同一面棱镜,折射出中国科技创新的新生态。当北大的学术基因遇上企业的工程化能力,产生的化学反应已超越单纯的技术突破,更体现出产学研深度融合的范式价值。在攀登人工智能高峰的征程中,如何将高校的智力优势转化为产业的核心竞争力,这个问题的解答或将决定未来全球科技竞争的格局。