中国人工智能产业迎来关键拐点 专家共议技术突破与产业升级路径

近期,开源框架OpenClaw全球开发者社区引发广泛关注,智能体(Agent)应用加速从概念走向落地。论坛现场,月之暗面首席执行官杨植麟主持对话,智谱首席执行官张鹏、无问芯穹联合创始人兼首席执行官夏立雪、小米MiMo大模型负责人罗福莉以及香港大学助理教授黄超等围绕“开源框架、词元增长与基础设施演进”进行交流,表达出产业链多环节正在同步加速的信号。 一、问题:智能体热潮下词元需求“快增”,推理成本成为硬约束 与会人士普遍提到,智能体应用与传统聊天式调用不同,其核心在于长程规划、多轮尝试、持续纠错与工具使用,带来更长上下文、更复杂链路与更高并发。由此产生的直接结果,是词元(Token)消耗显著上升。夏立雪表示,从今年初以来,其所在企业观测到词元调用量在短周期内快速增长,呈现明显的加速曲线。多位嘉宾认为,这种增长对算力供给、调度效率、网络与存储提出系统性挑战,成本与时延将成为影响智能体规模化落地的关键门槛。 二、原因:开源框架与能力工程化,正在抬升开源模型“可用上限” 罗福莉认为,OpenClaw带来的变化不止是交互形态更新,更重要的是通过控制框架与可组合技能模块,让原本在单点能力上略弱的模型,在复杂任务中也能获得更稳定、更接近高水平闭源模型的效果。这类“框架+技能”的工程化路径,降低了智能体应用开发门槛,吸引更多社区参与迭代,从而形成“开源促应用、应用促工具、工具促生态”的正循环。背景来看,开源模型与开源工具近两年持续活跃,正在从“模型开源”延伸至“数据、工具链、评测与安全治理”的全栈协同,产业竞争也从单纯比参数、比榜单,转向比可用性、可靠性与落地效率。 三、影响:从“会聊天”迈向“能干活”,价格与商业模式面临重估 围绕智谱新模型迭代与价格调整,张鹏表示,模型迭代的重点是提升执行复杂任务能力,包括长程任务规划、持续运行与自我修正等。“能干活”意味着更长的思考链条与更高的试错次数,完成一次复杂任务的词元消耗,可能远高于简单问答。与会嘉宾认为,随着智能体从演示走向生产,计费逻辑将更贴近实际消耗与交付价值;长期依靠低价竞争不利于形成可持续的研发投入与算力保障,行业需要在“普惠可用”和“高质量供给”之间找到新的平衡点。 四、对策:基础设施要从“为工程师设计”转向“为智能体运行而生” 夏立雪提出,未来的基础设施需要更强的自治能力:面向智能体的算力平台应在资源分配、负载预测、任务编排、故障自愈、安全隔离等实现更高程度自动化,甚至形成可根据需求自我迭代的系统。与会人士指出,从云计算向智能体时代演进,关键不只是堆叠算力,更要提升系统效率,包括高效推理引擎、分层缓存、异构计算协同、端云协同以及对长上下文推理的优化能力。同时,开源生态繁荣也要求更完善的评测体系、数据合规与安全治理,避免“能跑起来”但“不敢用、用不起、用不稳”。 五、前景:超长上下文与低成本推理将决定“自我迭代”能否真正到来 罗福莉认为,智能体之所以呈现“越用越好用”的趋势,与推理阶段可获得的上下文长度密切对应的;但超长上下文能否带来现实价值,取决于推理速度和成本能否同步下降。多位嘉宾判断,随着算法、系统与硬件协同优化推进,长上下文、强工具调用与高并发的能力将逐步成为行业标配;在此过程中,谁能率先建立高效率、低时延、可控成本的推理基础设施,谁就更可能在智能体应用规模化中占据主动。面向未来,开源与产业协作将继续加速,国内有望在工具链、工程化与应用生态上形成更具国际竞争力的供给能力。

智能体发展带来的词元需求增长,既说明了技术进步,也对算力体系、工程能力和商业模式提出新要求。开源生态需要规则与协作并重,在提升性能的同时优化成本效率。如何实现从"能用"到"好用"再到"规模化"的跨越,将决定行业未来的竞争格局。