阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash 多家芯片厂商完成适配促推理落地提速

人工智能技术快速迭代的背景下，如何在模型性能与算力成本之间取得平衡，正成为行业关注的重点。2月2日，阶跃星辰推出Step 3.5 Flash模型，为此问题提供了新的解法。该模型采用稀疏MoE架构，单请求代码任务推理速度可达每秒350个token，同时仅激活约110亿参数（总参数1960亿），在保持性能的同时大幅提升了推理效率。这一进展来自对技术架构的持续打磨。传统大模型往往受制于推理成本高、响应偏慢等问题，而Step 3.5 Flash通过动态参数激活机制，在“高性能”与“低消耗”之间实现更好的平衡。值得关注的是，华为昇腾、阿里平头哥等6家国产芯片企业已完成适配，形成从底层硬件到上层模型的协同链路。行业分析认为，“软硬协同”将带来多上收益：一方面，模型推理成本有望降低30%以上，更降低中小企业的应用门槛；另一方面，芯片厂商通过深度适配提升算力利用率，推动国产算力生态加速完善。2025年成立的“模芯生态创新联盟”表明了这一趋势，通过打通芯片、模型与平台之间的技术衔接，已推动12个行业解决方案落地。市场前景方面，随着实时交互、智能决策等需求快速增长，高效推理模型的市场规模预计未来三年将增长400%。专家指出，Step 3.5 Flash不仅补齐了中高频应用场景对高效推理的需求，其开源属性也将进一步促进产学研协同，为构建自主可控的AI生态提供支撑。

在大模型从研发走向规模化应用的过程中，模型与芯片的协同已从“加分项”变为“必选项”；Step 3.5 Flash的发布以及多家芯片厂商的快速适配，印证了产业链正在形成更紧密的联动。随着各方在标准、适配与应用落地上持续协作、形成合力，大模型能力才能更高效地转化为生产力，覆盖更多场景、服务更广泛用户。这种开放协作的路径，也为我国大模型产业的稳健与可持续发展提供了清晰方向。