申万宏源大模型报告

最近申万宏源出了份大模型的报告，我就顺着这个聊聊。报告主要是看智谱 AI 怎么把这次 IPO 做成了，同时把整个行业的现状和以后的机会也梳理了一下。说实话，现在大模型这事儿变化挺快，咱们得跟上节奏。以前那种摸索路线的时代已经过去了，现在大家都在拼效率。最核心的技术架构基本上都统一成 Decoder-Only 加上 MoE 的稀疏结构了。训练的时候不用像以前那样光用冷冰冰的数据，而是用高质量的合成数据去强化代码能力和长文本的处理。后训练阶段呢，也不再是单纯地喂数据了，转成了 GRPO 这种过程监督的方式，让模型自己学会推理。推理的时候也是想方设法降本增效，比如引入思维链技术或者量化技术。到了 2025 年，国内的模型在代码、多模态还有 Agent 这些方面迭代速度特别快。GLM-5 还有 Minimax 的 M2.5 都在 Arena Code 那个榜单上冲到了前面去。总体来看，咱们国产的东西跟国外顶尖的水平差距已经越来越小了。竞争格局这块儿比较有意思，国外的像 OpenAI、谷歌、Anthropic 这几家闭源的巨头还是牢牢把控着话语权，营收规模也不小。国内主要是互联网大厂加上智谱、Minimax、DeepSeek 这些独立做的公司在发力，开源的生态发展得也挺快。商业化这块儿也在加速落地了。核心主要集中在四个大方向上：一个是 AI 深度研究（Deep Research），还有 AI 编程工具这块儿像 Cursor、Claude Code ARR 的增长速度就特别快；第三个是多模态生成（可灵、海螺 AI 在变现方面走在了前面）；第四个是 AI Agent，现在多智能体架构已经成了大家都在搞的主流方向。其中代码工具这个市场空间特别大，中美两边中期的规模加起来都得超过一千亿美元呢，而且以后涨价的潜力也很明显。智谱 AI 能顺利突围 IPO，主要还是靠它是国产原生大模型的代表身份，加上清华的背景还有优先做 ToB 的策略。公司的底子就是 GLM 系列的基座模型，覆盖了推理、代码、多模态和 Agent 全场景。GLM-5 就是靠着 MoE 加上 DSA 这种架构实现了成本和性能双优的局面。价格虽然涨了不少，但调用量还是蹭蹭往上涨，这也说明实力确实强，才能在谈判桌上有底气。业务模式主要是靠本地化部署来赚钱，云端的 API 也在快速增长。服务的企业客户已经超过 8000 家了，涉及的领域也挺广的，像互联网、金融、政务这些都有。他们还很懂怎么适配国产的算力生态，在合规和落地这方面有很强的优势。目前公司还是处于高速增长高投入的阶段，亏损肯定是少不了的。不过我觉得长期来看增长的确定性还是很强的。