(问题)大模型产业进入深水区后,竞争焦点正变化。随着参数规模和训练数据持续扩张,单纯依靠堆算力、堆规模的边际收益在下降,模型的工程化落地、生态构建和成本效率成为企业与行业共同面对的新课题。如何在提升能力的同时降低训练与推理成本,如何加快应用增长并形成可持续的商业闭环,成为产业链各上前的现实问题。 (原因)论坛对应的活动和采访中,杨植麟提出,在“能力相当”的前提下,开源模式更可能形成压倒性优势。其逻辑是:开源能吸引更多开发者、工具链和渠道参与,推动应用更快扩散、覆盖更多场景,进而带动Token使用规模增长,形成生态正循环。相较之下,闭源模式在部分细分市场仍有优势,但生态外溢效应有限,难以在更大范围内调动社会化创新资源。这也反映出当前全球大模型竞争正在从单点突破转向体系化能力比拼:谁能更高效组织开发者、产业伙伴与基础设施供给,谁就更有机会在下一阶段获得规模优势。 支撑“生态决定胜负”的另一层原因,是底层技术路线正在被重新审视。杨植麟在演讲中强调,大模型的本质是“把更多能源转化为智能”,产业竞争本质上是转化效率的竞赛。随着Transformer等主流架构在行业应用接近十年,一些长期被视为“标准答案”的模块与训练范式开始显露效率瓶颈,促使企业把创新更下沉到网络结构与训练机制。他提出,包括Transformer架构、残差连接、优化器等在内的传统范式仍有改进甚至被替代的空间。其团队提到的“注意力残差”等探索,意在以更小的额外成本撬动训练效率与推理能力提升,反映出行业对“低成本提升智能密度”的现实需求。 (影响)上述变化将对产业格局带来多重影响:其一,开源有望更快形成大规模应用生态,推动从模型、工具链到行业解决方案的分工协作,带动更多中小开发者与企业参与创新,促进技术扩散与产业普惠。其二,竞争焦点将进一步向基础设施倾斜。杨植麟提出“竞争转向Token工厂”,强调未来胜负不仅取决于算法与模型,还取决于算力供给、能源成本、数据与工程效率、软硬件协同等综合能力,产业链上游的重要性将明显上升。其三,智能体作为“新生产力形态”的可能性上升。相较传统对话式应用,智能体强调长时间运行、任务规划、工具调用与复杂流程执行,对长上下文处理、可靠性与安全性提出更高要求,也将推动推理侧算力需求快速增长。 值得关注的是,杨植麟提出“Token消耗在一定程度上可映射经济产出”的观点,认为随着智能体更多进入生产环节,Token使用规模可能成为衡量数字生产活动的新指标。业内人士指出,这个提法仍需在统计口径、产业测算与宏观传导机制上进一步论证,但其指向清晰:未来数字经济的价值创造过程将更可计算、可计量,算力与能效会更直接影响企业成本结构与产业竞争力。 (对策)面向新趋势,行业需要在创新、治理与基础设施三上合力推进。一是以开放促繁荣,鼓励开源与开放标准建设,完善从模型、框架到工具链的生态供给,推动形成可复用、可迁移、可验证的产业能力,降低企业应用门槛。二是以底层创新提效率,架构、训练方法、推理加速、模型压缩与端侧部署等方向持续投入,推动“同等算力更高智能密度”的技术突破,避免陷入高成本“军备竞赛”。三是以基础设施夯实供给,围绕算力调度、数据治理、能耗管理、芯片与系统软件协同优化等关键环节补短板,加快形成稳定、可持续、成本可控的“Token供给能力”。四是以安全与规范护航应用扩张,在智能体进入生产流程的背景下,同步加强可信评测、数据合规、权限管理、风险审计与可追溯机制建设,守住安全底线与发展边界。 (前景)从全球视角看,大模型创新正从“追随式迭代”转向“体系性竞争”。杨植麟在论坛期间还提到部分中国技术方案进入海外产品与基础设施体系的案例,显示中国团队在工程化能力与产品化落地上的国际影响力正在提升。展望未来,随着研发范式向“自动化研究”演进,更多研究工作可能由算力驱动的自动任务生成、环境构建与架构探索来完成,创新速度有望进一步加快。同时,行业也将更依赖高质量数据、可靠评测与产业协作,竞争将从单一模型能力延伸为“技术—生态—基础设施—治理”全链条比拼。
大模型产业正在从“比参数、拼速度”的上半场,走向“比生态、拼效率”的下半场。开源与开放为创新扩散提供了更大的杠杆,智能体推动Token需求走向常态化、工业化,而“Token工厂”背后的能效与基础设施能力将成为关键变量。把握趋势、夯实底座,坚持合力推进并守住规范底线,才能把技术热度转化为持续的产业动能与高质量发展增量。