lmarena 再次更新,中国大模型领域取得了可喜的成绩

3月20日,全球大模型排行榜LMArena再次更新,我国大模型领域取得了可喜的成绩。阿里推出的千问3.5旗舰版预览模型,给业界带来了巨大的惊喜。这款模型超越了GPT5.4和Claude4.6,成为中国最强大的模型。凭借Qwen3.5-Max-Preview这个预览版,阿里在LMArena竞技场中一举拿到了1464分的高分。 这个得分不仅超过了豆包2.0、GLM5、Kimi2.5等全部国产模型,还超过了GPT5.4、Claude4.5、Grok4.1等国外顶尖大模型。此外,Qwen3.5-Max-Preview在全球大模型竞技场中还把其他5家中国公司都带进了前十。这些公司包括字节、智谱、月之暗面和百度。Anthropic、谷歌、xAI和OpenAI则占据了前五的位置。 在这次LMArena排名中,Qwen3.5-Max-Preview表现出色。它在考验模型绝对胜率的总榜中排名第六,在数学能力子榜单中排名第五,在专家级文本能力子榜单中排名第十。这个预览版给了大家一个好的开始,大家都很期待Qwen3.5-Max正式版的发布。它的能力还有可能继续进化升级。 Qwen3.5是今年除夕由阿里发布的新一代大模型。它总参数3970亿激活170亿,以小胜大,发布后迅速闯入了LMArena前二十。Qwen3.5共开源8款不同尺寸模型,均拿到了同尺寸最佳性能SOTA的称号。这个旗舰版Qwen3.5-Max也因此备受期待。 LMArena是由国际开源机构LMSYS组织的第三方大模型测评榜单。它通过让全球开发者在不知晓具体模型的情况下进行两两PK来形成最后的分数和排名。LMArena被认为是AI领域最公正、最权威的全球大模型性能榜单之一。千问是LMArena榜单的常客,多次代表中国在全球大模型竞技场中获得最佳性能表现。 以阿里千问为代表的中国大模型正在迅速崛起。这次更新后中美两国各占据了全球前十的半壁江山:Anthropic、谷歌、xAI、OpenAI和阿里位列前五;字节、智谱、月之暗面、百度和亚马逊分列第六到第十名。 千问2.5、3和3.5三代模型在Arena上的得分对比也显示出了进步趋势。Qwen3.5-Max正式版或将于近期发布,相信它将带来更多惊喜给我们期待已久的开发者们。 同时值得注意的是在这次更新中还出现了Claude4.6这个版本,它也是这次竞争中的一员。CLAUDE是Anthropic公司开发的一个AI助手系列产品,Claude4.6可能会给我们带来更多创新和改进。 这次更新还提到了GLM5这个版本。GLM是月之暗面公司开发的一个AI生成语言模型系列产品之一,GLM5也将为我们带来更多期待和惊喜。 这次更新给我们展示了人工智能领域正在不断进步和发展。无论是中国还是全球范围内都有优秀人才在这个领域努力创新着。 随着人工智能技术不断进步与普及化程度提高以及各企业投入研发力量加大力度来看待人工智能技术已经成为全球趋势,相信未来还会有更多优秀产品涌现出来给我们带来惊喜!