东吴证券: 端侧ai 入口重塑与硬件范式重构

端云协同促使AI的入口模式重新定义，还推动了硬件的升级换代。东吴证券发布的深度报告指出，2024年的行业重点在于满足高频、刚需的场景需求，比如图片去水印和文本摘要，这些都是容易实现的功能。到了2025年，各家厂商纷纷加快脚步，把能力扩展到多模态创作领域，比如语音和生成式图像，还把触角伸到了操作系统底层。现在的竞争不再是比谁的功能多，而是比谁的体验好和系统整合得深。云端模型正经历能力边界的扩展和成本结构的重塑。作为端侧AI发展的源头变量，评价云端模型的标准已经从单纯看指标转向能否把任务真正搞定。2026年以来，海外的领头企业都在忙着围绕代码能力和多Agent体系布局。智能体时代对推理的要求主要在长链复杂推理和实时交互这两个方向同时发展。像OpenAI的Codex-Spark这种Agent追求低延迟体验，让开发者在生成过程中能随时打断修改；Claude4.6则通过增加上下文长度提升成功率，还会带动推理侧的算力消耗持续增加。预计未来一段时间，“快交互加长推理”的双能力栈会成为通用Agent的主流发展方向。多智能体框架也越来越被主流厂商采用。春节期间国内模型厂商更新频繁，性能逐渐赶上海外顶尖水平，价格也在快速下降。应用侧的需求开始释放出来。云端模型的成功给端侧模型提供了参照。端侧模型不会完全取代云端大模型，而是跟它形成分工协作的架构：高频、轻量化且强隐私的任务由端侧本地处理；需要大算力的任务则打包上云去做。当前端侧模型的发展有两个核心方向：一是多模态能力是关键竞争点，全双工流式架构是实现零延迟交互的理想选择；二是算法压缩用于节省功耗和内存等硬件资源，主要通过模型架构优化和低比特量化等手段把计算和存储开销压到最低。在整机级AI功能升级为多模态的背景下，端侧核心部件正围绕内存和功耗进行升级。在存储方面，三星的LPDDR6产品通过电路和电源管理的重构实现了21%的能效提升；在散热方面，三星在2025年12月19日发布Exynos2600芯片时引入了High-k EMC材料优化热传输路径，使热阻比Exynos2500降低了约16%。这种材料有效缓解了发热导致的降频问题。未来高通的Snapdragon8Elite Gen6等平台有望在算力、存储和散热上同步升级。这次东吴证券的报告还给出了投资要点：云端大模型作为端侧AI的源头变量正在从能力指标转向任务完成度的考量。为了应对这个变化，2026年以来海外头部厂商围绕代码能力与多Agent体系展开布局。快交互与长推理的双能力栈成为通用Agent的重要方向。国内模型厂商在春节期间更新频繁，性能接近海外头部且价格下降明显。春节期间国内模型厂商更新频繁且价格下降明显说明应用侧需求开始释放出来。中国春节期间国内模型厂商更新频繁且价格下降明显说明应用侧需求开始释放出来这也给端侧模型提供了可参考模板。三星Exynos2600芯片于2025年12月19日发布首次在移动SoC中引入High-k EMC材料优化热传输路径使得热阻降低了约16%。三星LPDDR6产品在支持更高数据传输速率和内存带宽的情况下实现了约21%的能效提升。内存带宽、功耗约束下提高端侧交互实时性和效率成为多模态token压缩技术环节的关键问题。高通Snapdragon8Elite Gen6等下一代旗舰SoC平台有望在算力、存储与功耗散热方面同步升级。陈海进认为这次东吴证券的报告对端云协同驱动下的AI入口重塑与硬件范式重构进行了深入剖析并给出了具体的投资建议。