申万宏源大模型报告

最近申万宏源出了份大模型的报告,我就顺着这个聊聊。报告主要是看智谱 AI 怎么把这次 IPO 做成了,同时把整个行业的现状和以后的机会也梳理了一下。说实话,现在大模型这事儿变化挺快,咱们得跟上节奏。以前那种摸索路线的时代已经过去了,现在大家都在拼效率。最核心的技术架构基本上都统一成 Decoder-Only 加上 MoE 的稀疏结构了。训练的时候不用像以前那样光用冷冰冰的数据,而是用高质量的合成数据去强化代码能力和长文本的处理。后训练阶段呢,也不再是单纯地喂数据了,转成了 GRPO 这种过程监督的方式,让模型自己学会推理。推理的时候也是想方设法降本增效,比如引入思维链技术或者量化技术。 到了 2025 年,国内的模型在代码、多模态还有 Agent 这些方面迭代速度特别快。GLM-5 还有 Minimax 的 M2.5 都在 Arena Code 那个榜单上冲到了前面去。总体来看,咱们国产的东西跟国外顶尖的水平差距已经越来越小了。竞争格局这块儿比较有意思,国外的像 OpenAI、谷歌、Anthropic 这几家闭源的巨头还是牢牢把控着话语权,营收规模也不小。国内主要是互联网大厂加上智谱、Minimax、DeepSeek 这些独立做的公司在发力,开源的生态发展得也挺快。 商业化这块儿也在加速落地了。核心主要集中在四个大方向上:一个是 AI 深度研究(Deep Research),还有 AI 编程工具这块儿像 Cursor、Claude Code ARR 的增长速度就特别快;第三个是多模态生成(可灵、海螺 AI 在变现方面走在了前面);第四个是 AI Agent,现在多智能体架构已经成了大家都在搞的主流方向。其中代码工具这个市场空间特别大,中美两边中期的规模加起来都得超过一千亿美元呢,而且以后涨价的潜力也很明显。 智谱 AI 能顺利突围 IPO,主要还是靠它是国产原生大模型的代表身份,加上清华的背景还有优先做 ToB 的策略。公司的底子就是 GLM 系列的基座模型,覆盖了推理、代码、多模态和 Agent 全场景。GLM-5 就是靠着 MoE 加上 DSA 这种架构实现了成本和性能双优的局面。价格虽然涨了不少,但调用量还是蹭蹭往上涨,这也说明实力确实强,才能在谈判桌上有底气。 业务模式主要是靠本地化部署来赚钱,云端的 API 也在快速增长。服务的企业客户已经超过 8000 家了,涉及的领域也挺广的,像互联网、金融、政务这些都有。他们还很懂怎么适配国产的算力生态,在合规和落地这方面有很强的优势。 目前公司还是处于高速增长高投入的阶段,亏损肯定是少不了的。不过我觉得长期来看增长的确定性还是很强的。