IT之家在2月11日带来了一个令人振奋的消息,智谱正式发布了全新一代的大模型GLM-5。摩尔线程不负众望,基于SGLang推理框架,在旗舰级的AI训推一体全功能GPU MTT S5000上,把全流程适配与验证的工作在Day-0就搞定了。这个过程可不容易,因为MTT S5000 是基于第四代MUSA架构“平湖”打造的智算卡,单卡AI算力最高能达到1000 TFLOPS,给GPU带来了强大的算力支持。它还配备了80GB显存和1.6TB/s的带宽,这给AI运算提供了强有力的保证。为了充分发挥 MTT S5000 的潜能,摩尔线程使用了他们强大的生态兼容能力和广泛的算子覆盖来打通模型推理全链路。他们给模型释放了原生的FP8加速能力,在确保模型精度的同时降低了显存占用。 这一次发布给大家展示了最先进的Agentic Engineering(代理工程)能力。这个新版本拥有深厚的代码功底,还能处理复杂系统工程与长程Agent任务。它可以实现从需求到应用的端到端开发,这对程序员们来说可是一个巨大的福音。智谱此次发布的GLM-5定位为目前最顶尖的Coding模型。其整体性能较上一代提升了20%。这20%可不是随便说说的结果,它是靠先进技术支撑实现的。 摩尔线程这次在Day-0把GLM-5和MTT S5000完美结合起来后,它在Intel FP8加速能力下的推理性能也提升了20%。相信这个性能提升会给众多开发者带来极大的便利和创造力。这个升级还不仅如此呢,FP8加速能力还允许开发者选择不同精度级别进行计算。比如你可以选择FP8、FP64等不同精度进行运算, 让用户可以根据自己的需求灵活调整运算精度。 总之,这个消息让我们看到了未来计算机技术发展的前景更加光明。摩尔线程给我们带来了一次又一次的惊喜,相信他们未来会有更多精彩的表现。