qwen3.5-397b-a17b 模型，让开发者直接用musa c写内核代码

大家好，IT之家给大伙带来一条关于AI和芯片的重要消息，之前阿里已经放出了一款超大的Qwen3.5-397B-A17B模型，这回他们又一口气拿出了三个中等规模的新家伙：Qwen3.5-35B-A3B、Qwen3.5-122B-A10B，还有那个用Dense结构的Qwen3.5-27B。面对这一大波更新，摩尔线程的MTT S5000 GPU反应相当迅速，直接把这三个模型都给适配好了。为了让开发者用上这些新模型，他们的MUSA生态亮出了两个绝招：第一个是让开发者直接用MUSA C写内核代码，这就大大降低了从CUDA那边转移过来的门槛；第二个是深度兼容了Triton-MUSA，大家平时用熟悉的Triton语法去写高性能算子就能用，根本不用改代码。在底层技术方面，MTT S5000针对Qwen3.5那种多模态模型里用的混合注意力机制进行了专门优化。靠的是muDNN这个计算库还有MATE里的开源算子库，他们给长序列的处理提供了很强的支持，结果就在这次的推理中表现得非常高效。