近期,随着GLM-4.7模型正式上线,智谱科技旗下GLM Coding Plan用户规模快速增长,带来阶段性算力紧张。部分用户调用高峰期出现并发限流、响应延迟等情况。技术分析认为,资源紧张主要来自三上:一是新模型上线带动用户集中涌入;二是部分违规账号不当占用计算资源;三是基础设施扩容节奏短期内跟不上业务增长。
在人工智能应用快速迭代的背景下,产品热度上升往往会放大资源与体验的矛盾。智谱AI针对Coding Plan用户激增采取限量销售措施,是对阶段性算力压力的直接应对,也是在优先保障存量用户体验上的取舍。随着扩容推进与新模型迭代落地,这个阶段性措施有望逐步退出,服务稳定性与整体体验也将随之改善,为更多开发者提供更顺畅的编程支持。