算力供需阶段性趋紧智谱推出GLM Coding Plan限售措施并加快扩容

智谱近日发布公告，宣布对GLM Coding Plan实行限售，以缓解近期算力资源紧张；这个调整折射出国内大模型应用快速落地过程中面临的现实压力。问题与产品迭代密切对应的。自GLM-4.7版本上线后，性能提升带动大量新用户涌入，Coding Plan用户规模快速增长——算力需求随之陡增——系统在高峰期出现并发限流、响应变慢等情况，影响了使用体验。这类供需错配在大模型商业化初期并不少见，也暴露出企业在扩张阶段的技术与资源瓶颈。为应对上述问题，智谱推出了多项措施。首先是调整供给优先级，通过限量发售保障存量用户使用。公司将日销售量控制在当前水平的20%，为既有用户预留更多算力，尽量稳定编程体验。限售自1月23日10时起执行，此后每日10时刷新可用额度；已开通自动续订的用户不受影响。其次是加强平台治理。智谱表示将加大对违规账号的监测和处置力度，遏制异常占用算力的行为，重点针对恶意流量与资源滥用，以改善整体资源使用效率。在供给侧，智谱同步推进技术优化与基础设施扩容。公司近期发布并开源了GLM-4.7-Flash模型，该模型为混合思考型大模型，总参数量30B、激活参数量3B，在保持性能的同时降低计算成本和部署门槛，为开发者提供更灵活的选择。轻量化模型的推出有助于缓解算力压力，也为不同应用场景提供更匹配的方案。从行业角度看，这多项动作具有代表性。大模型产业正从技术验证走向规模化应用，企业需要在增长速度与服务稳定性之间做取舍。限售短期内可能抑制新增，但通过优先保障体验来维护口碑，更符合长期利益。同时，开源轻量化模型以降低门槛，也表明了其对生态建设的重视。智谱表示，限售结束时间将另行通知，取决于算力扩容进展。公司正研发更高效的模型，并加快推进算力基础设施建设，后续将推出更优化的服务。

此次限售是阶段性措施，但也提示了人工智能产业从技术突破走向服务落地时的共性问题：如何在持续迭代与稳定体验之间取得平衡，如何建设更具弹性的算力与平台体系，都是行业绕不开的课题；智谱的做法表明了对问题的及时应对，也为同类企业提供了可借鉴的思路。

算力供需阶段性趋紧 智谱推出GLM Coding Plan限售措施并加快扩容

算力供需阶段性趋紧智谱推出GLM Coding Plan限售措施并加快扩容