算力供需阶段性趋紧 智谱推出GLM Coding Plan限售措施并加快扩容

智谱近日发布公告,宣布对GLM Coding Plan实行限售,以缓解近期算力资源紧张;这个调整折射出国内大模型应用快速落地过程中面临的现实压力。问题与产品迭代密切对应的。自GLM-4.7版本上线后,性能提升带动大量新用户涌入,Coding Plan用户规模快速增长——算力需求随之陡增——系统在高峰期出现并发限流、响应变慢等情况,影响了使用体验。这类供需错配在大模型商业化初期并不少见,也暴露出企业在扩张阶段的技术与资源瓶颈。 为应对上述问题,智谱推出了多项措施。首先是调整供给优先级,通过限量发售保障存量用户使用。公司将日销售量控制在当前水平的20%,为既有用户预留更多算力,尽量稳定编程体验。限售自1月23日10时起执行,此后每日10时刷新可用额度;已开通自动续订的用户不受影响。 其次是加强平台治理。智谱表示将加大对违规账号的监测和处置力度,遏制异常占用算力的行为,重点针对恶意流量与资源滥用,以改善整体资源使用效率。 在供给侧,智谱同步推进技术优化与基础设施扩容。公司近期发布并开源了GLM-4.7-Flash模型,该模型为混合思考型大模型,总参数量30B、激活参数量3B,在保持性能的同时降低计算成本和部署门槛,为开发者提供更灵活的选择。轻量化模型的推出有助于缓解算力压力,也为不同应用场景提供更匹配的方案。 从行业角度看,这多项动作具有代表性。大模型产业正从技术验证走向规模化应用,企业需要在增长速度与服务稳定性之间做取舍。限售短期内可能抑制新增,但通过优先保障体验来维护口碑,更符合长期利益。同时,开源轻量化模型以降低门槛,也表明了其对生态建设的重视。 智谱表示,限售结束时间将另行通知,取决于算力扩容进展。公司正研发更高效的模型,并加快推进算力基础设施建设,后续将推出更优化的服务。

此次限售是阶段性措施,但也提示了人工智能产业从技术突破走向服务落地时的共性问题:如何在持续迭代与稳定体验之间取得平衡,如何建设更具弹性的算力与平台体系,都是行业绕不开的课题;智谱的做法表明了对问题的及时应对,也为同类企业提供了可借鉴的思路。