人工智能技术发展正处于关键时期。自2018年以来,基于"预测下一个词元"的自回归学习在语言大模型领域收效良好,但在处理图像、视频等多模态数据时,业界普遍采用对比学习、扩散模型等不同的技术方案。这种技术分化导致多模态系统架构复杂、训练成本高,成为制约通用人工智能发展的瓶颈。
基础研究的突破是抢占科技竞争制高点的重要途径。多模态大模型"统一路线"的验证——既回应了长期的学术争论——也为后续创新开辟了新空间。未来需要在继续攻关核心技术的同时,协调开放协作与安全治理,让原创成果更快转化为推动经济社会高质量发展的新动力。