国产多模态模型研发取得突破性进展科技企业联合攻关加速自主创新进程

2026年伊始，国产大模型产业迎来创新密集期。

多家AI企业相继推出重磅成果，标志着我国在大模型技术领域的自主创新能力正在不断提升。

智谱与华为的合作成为业界关注焦点。

1月14日，最近登陆港交所的AI企业智谱宣布联合华为开源新一代图像生成模型GLM-Image。

这一合作具有标志性意义，GLM-Image成为首个在国产芯片昇腾Atlas 800T A2上完成全流程训练的SOTA级多模态模型，打破了国产算力底座在高性能模型训练上的应用空白。

从技术架构看，GLM-Image采用自主创新的"自回归加扩散解码器"混合架构，融合9B自回归模型与7B DiT扩散解码器，实现了图像生成与语言模型的有机结合。

相比传统模型难以兼顾"理解复杂指令"与"精准绘制文字"的问题，该模型通过改进Tokenizer策略，能够自适应处理多种分辨率，原生支持1024×1024至2048×2048尺寸的任意比例图像生成，无需重新训练。

这一设计充分体现了工程化思维在AI模型优化中的应用价值。

在训练效率方面，智谱依托昇腾NPU和昇思MindSpore AI框架，采用动态图多级流水下发、高性能融合算子、多流并行等优化策略，全面提升了数据预处理、预训练、监督微调和强化学习的端到端流程效率。

通过消除下发瓶颈、打破通信墙等手段，不仅提升了训练性能，更增强了模型稳定性。

这一成果验证了在国产全栈算力底座上训练高性能多模态生成模型的可行性，对推动国产AI芯片生态建设具有重要示范意义。

除智谱外，其他国产AI企业的创新步伐同样值得关注。

MiniMax在同日正式开源首个面向Coding Agent的系统性评测集OctoCodingBench，为下一代通用人工智能的落地标准提供了量化参考。

评测结果显示，部分开源模型在过程合规指标上已快速逼近甚至超越部分闭源模型，这反映出开源生态的加速成熟。

DeepSeek则在基础理论研究上取得突破。

1月12日发布的新论文《基于可扩展查找的条件记忆：大语言模型稀疏性的新维度》，由北京大学和DeepSeek联合完成，核心针对当前大语言模型存在的记忆力短板，提出"条件记忆"新概念。

业界普遍预期，基于这一理论探索，DeepSeek下一代模型V4有望在春节前后发布。

视频生成领域也迎来突破。

爱诗科技推出全球首个支持最高1080P分辨率通用实时世界模型PixVerse R1，将视频生成延迟从秒级降至即时响应，实现了"所想即所见、所说即所现"的实时交互体验。

这一进展标志着AIGC领域的视频生成从"静态输出"迈入"实时交互"的新阶段。

从市场表现看，智谱上市后股价表现亮眼，截至1月14日港股午盘涨幅达16.83%，较发行价116.2港元/股已上涨超80%。

这反映出资本市场对国产大模型产业前景的认可，也表明投资者对这些企业创新能力的信心。

观察这一系列创新，其背后反映出国产AI产业的几个重要特点。

首先，企业正在从单纯的模型堆砌向工程化优化转变，注重在国产硬件上的适配和优化。

其次，开源生态正在加速成熟，越来越多企业选择开源模型和评测数据，促进了行业的良性竞争。

第三，多模态、实时生成等新技术方向成为创新重点，预示着AI应用的进一步拓展。

新年密集发布的背后，是我国大模型产业从“技术突破”走向“体系突破”的信号：算力底座更扎实，开源生态更活跃，评测标准更受重视，应用落地更趋务实。

面向未来，只有在开放创新与安全治理之间把握好尺度，在工程能力与场景价值之间建立可复制路径，才能让大模型真正从“热度”走向“厚度”，更好服务高质量发展与人民生产生活。

国产多模态模型研发取得突破性进展 科技企业联合攻关加速自主创新进程