前阿里技术高管林俊旸深度解析AI技术演进：从“推理”迈向“智能体”时代

问题——大模型竞争从“会说”到“会想”，下一步走向何处？随着大模型通用问答、内容生成等领域加速普及，行业评估标准正在发生变化：单纯比参数规模与静态测评得分的时代逐渐退潮，模型是否具备可训练、可交付的推理能力，以及能否在复杂任务中稳定行动，成为新的关注点。林俊旸在文章中将2024年至2025年概括为“推理思考”阶段，认为此阶段的重要意义在于证明“思考”可以成为一种可被训练并面向用户开放的一流能力，但同时也暴露出工程化落地与商业交付的现实矛盾。原因——强化学习驱动的推理训练抬升门槛，且与产品需求存在张力在技术层面，推理能力的增强通常依赖强化学习等后训练手段，尤其在数学、代码等“可验证”领域，通过明确反馈信号促使模型朝“正确性”而非“表面合理性”优化。这一路径带来效果提升的同时，也将挑战从算法本身推向系统工程：训练与评测需要更高吞吐的验证体系、更稳定的任务生成与判定流程，以及更精细的算力与数据调度能力。推理强化学习不再是轻量级“外挂”，而成为贯穿训练、评测、部署的基础设施能力。在产品层面，推理模式与指令模式的融合并非一条直线。文章提到，在实际业务中，大量企业用户仍高度看重批量任务的成本、延迟与可控性，更偏好确定、简洁、可预测的指令式行为。这意味着，“更会思考”的模型并不必然等同于“更好用”的产品：一上推理链路可能带来额外算力消耗与响应时延；另一方面，过度“思考”也可能引入不必要的步骤，影响稳定性与一致性。由此，模型能力的演进与客户交付形态之间需要更精细的分层与组合。影响——竞争焦点或从“单模型能力”转向“系统能力”，环境成为关键变量文章继续提出“智能体式思考”将成为下一代核心范式。其要义于：训练与能力边界不再仅由模型参数决定，而由“模型—环境”共同塑造。与纯推理模型相比，智能体需要处理更复杂的现实约束，包括何时行动、调用何种工具、如何应对不确定反馈、在失败后如何修订计划、如何在多轮交互中保持目标一致与上下文连贯等。这些问题决定了智能体不仅是“会推理”，更要“为行动而思考”。在这一框架下，竞争优势的来源将发生变化：推理阶段更倚重强化学习算法与反馈信号设计；智能体阶段则更依赖高质量环境构建、训练与服务的一体化架构，以及多智能体协同工程能力。环境被视为“一等品”——其真实性、稳定性、反馈丰富度与抗过拟合能力，将直接影响智能体在真实场景中的表现。另外，多智能体组织形态可能成为提升系统智能的重要路径：通过规划者、领域专家、执行子代理等分工协作，以流程化、可审计的方式完成复杂任务，从而在可靠性与效率之间寻求平衡。对策——以工程化与标准化推动落地，兼顾可用、可控与可持续业内人士认为，要推动“智能体式思考”从概念走向规模应用，需要在三上形成合力：一是补齐基础设施短板。围绕高吞吐验证、自动化评测、线反馈闭环等关键环节建设通用能力，降低推理训练与智能体迭代的工程成本。二是推进产品形态分层。面向不同客户需求，提供指令型、推理型与智能体型能力的组合式供给，明确成本、时延、可控性与能力上限的边界，减少“能力越强越难用”的交付落差。三是强化安全与治理。智能体在工具调用、外部交互、任务执行中面临更高的安全风险与合规挑战，需要在权限控制、日志审计、行为约束、异常回滚诸上建立制度化机制，确保可追溯、可监管、可纠偏。前景——从“比聪明”走向“比体系”，产业将进入系统协同的新阶段综合来看，大模型发展正从“模型中心”迈向“系统中心”。未来一段时间，决定竞争格局的或不仅是某个模型在榜单上的领先，而是能否构建稳定可复用的环境、形成高效的训练—推理—执行闭环，并把多智能体协作能力转化为可规模复制的工程体系。谁能在可靠性、成本与效率之间找到可持续的平衡点，谁就更可能在新一轮产业竞争中占得先机。

从"推理式思考"到"智能体式思考"的演进，反映了大模型竞争逻辑的根本转变：技术突破不再仅依赖参数优化，而是转向环境构建、工程实现和系统协作的综合较量。未来，能够将技术能力转化为实用系统，并将系统深度融入产业实践的企业，更有可能把握住下一波发展机遇。