qwen3.5-397b-a17b 模型,让开发者直接用musa c写内核代码

大家好,IT之家给大伙带来一条关于AI和芯片的重要消息,之前阿里已经放出了一款超大的Qwen3.5-397B-A17B模型,这回他们又一口气拿出了三个中等规模的新家伙:Qwen3.5-35B-A3B、Qwen3.5-122B-A10B,还有那个用Dense结构的Qwen3.5-27B。面对这一大波更新,摩尔线程的MTT S5000 GPU反应相当迅速,直接把这三个模型都给适配好了。为了让开发者用上这些新模型,他们的MUSA生态亮出了两个绝招:第一个是让开发者直接用MUSA C写内核代码,这就大大降低了从CUDA那边转移过来的门槛;第二个是深度兼容了Triton-MUSA,大家平时用熟悉的Triton语法去写高性能算子就能用,根本不用改代码。在底层技术方面,MTT S5000针对Qwen3.5那种多模态模型里用的混合注意力机制进行了专门优化。靠的是muDNN这个计算库还有MATE里的开源算子库,他们给长序列的处理提供了很强的支持,结果就在这次的推理中表现得非常高效。