问题——大模型“更会推理”之后,行业下一步往哪走 过去两年,针对大模型能力的讨论持续升温,评测标准与用户期待亦随之改变。从“更像人”到“更正确”、从“会回答”到“会推理”,推理能力被视作关键增量。林俊旸最新文章中提出,当前行业仍在集中攻坚“推理式思考”——让模型在回答前进行更长链路的推导、在推理阶段投入更多算力、通过更强奖励机制强化正确性,并探索将思考过程向用户开放或加以约束。 但他同时指出,真正需要回答的问题是:当推理能力被系统性强化后,下一阶段的核心能力将是什么。其判断是,行业将从“推理式思考”迈向“智能体式思考”,即为行动而思考、在持续与环境交互中规划与调整,并根据外部反馈不断更新策略。 原因——为何推理模型崛起背后,关键在“可验证反馈”与工程化能力 林俊旸认为,推理模型的快速进展揭示了一条相对清晰的路径:若要将强化学习等后训练方法在语言模型上规模化应用,必须拥有确定、稳定且可扩展的反馈信号。在数学、代码、逻辑等可验证领域,答案对错可以被自动判定,奖励信号更“硬”,强化学习优化目标更接近“正确性”而非“看起来合理”。这也解释了为何有关能力在这些领域率先取得突破,并反向带动行业对通用推理能力的信心。 同时,推理能力的提升并非单点技术即可完成,而是基础设施与系统工程的综合结果。长轨迹推理需要大规模采样与rollout,需要高吞吐验证机制、稳定的策略更新和高效的数据与算力调度。换言之,推理模型不仅是算法迭代的故事,也是工程体系、训练组织与平台能力的竞争。 影响——从“释放模型能力”到“训练智能系统”,产业逻辑或将改写 文章引发关注的另一层原因在于其对“智能体”的定位发生变化。以往业内谈智能体,多从应用形态出发:模型足够强大,为了更好调用工具、执行任务、分解流程,构建智能体是一种“释放模型能力”的方式。而林俊旸更强调,智能体将成为更核心的智能系统本体,模型反而只是系统中的一个组件。 这个判断意味着资源投入与训练范式可能随之调整:未来竞争不再仅是参数规模、数据体量或单模型能力曲线的较量,而是围绕“模型+工具+记忆+规划+验证+反馈”的整体系统如何协同训练、如何在真实环境中迭代优化。对产业而言,这将推动大模型从“对话式产品”深入走向“执行型系统”,在研发、办公、客服、运营、供应链等场景形成更强的闭环能力,同时也对安全治理、权限控制、可追溯审计提出更高要求。 对策——面向智能体系统竞争,应补齐三类能力短板 业内人士认为,若“智能体式思考”成为趋势,相关主体需提前布局至少三上能力。 一是建立可扩展的反馈与评测体系。智能体要在环境中行动,反馈信号不再仅来自题目对错,而可能来自任务成功率、成本、时延、稳定性与合规性等综合指标。如何将这些指标转化为可训练、可复现的信号,将成为关键。 二是强化系统工程与基础设施建设。智能体需要高并发工具调用、可靠的验证链路、可控的执行沙箱与全链路日志。训练与推理阶段的资源调度、数据闭环、策略更新同样需要平台化支撑。 三是完善安全与治理机制。智能体越能执行任务,越需要边界清晰的权限体系、风险分级与人类在环机制,防止在真实业务中产生误操作、数据泄露或合规风险。 前景——下一轮竞争或在“系统级训练”与“可落地闭环”上见分晓 从发展节奏看,推理模型阶段解决的是“更会想”的问题,而智能体阶段更关注“想了能做、做了能改”。在可预见的未来,技术路线可能呈现两条并行主线:一条继续提升模型本体的推理、规划与泛化能力;另一条则加速智能体系统化落地,通过环境交互、工具调用与反馈学习形成持续迭代的能力飞轮。 业内普遍认为,谁能率先在真实场景中建立稳定、可复制的闭环训练与部署体系,谁就更可能在下一阶段竞争中取得主动。这不仅考验模型能力,更考验工程组织、产品化能力以及对行业场景的理解深度。
人工智能发展进入深水区,每一次范式变化都意味着新的机遇与挑战。林俊旸的研究梳理了技术演进的关键脉络,也提出了从“推理”走向“智能体”的下一步方向。在全球科技竞争加速的背景下,这类面向落地与系统能力的思考,可能为新一轮人工智能发展提供重要参考。