我国科技企业除夕发布新一代多模态大模型 关键技术指标达全球领先水平

国产大模型竞争进入新阶段。阿里巴巴农历除夕发布千问3.5-Plus,该时间点也折射出AI产业加速迭代的节奏。该模型总参数达3970亿,但激活参数仅为170亿,通过大幅压缩激活规模实现了性能提升,并在多项国际评测中取得领先表现。模型性能的提升来自底层架构的关键创新。千问团队自研的门控技术曾获2025年NeurIPS最佳论文奖,有关成果已融入千问3.5的混合架构设计。通过结合线性注意力机制与稀疏混合专家架构,千问3.5在效率上深入提升——以不足40%的参数量获得可对标万亿参数模型的表现。在推理、编程、智能体等多项基准评估中均表现突出,尤其在多模态推理、视觉问答、文本识别、空间智能和视频理解等方向拿到更优成绩。推理效率的大幅提升是其主要竞争力。相比前代,千问3.5在常用的32K上下文场景下推理吞吐量提升8.6倍,在256K超长上下文下最高提升至19倍;同时部署显存占用降低60%,进一步降低使用成本与部署门槛,对大规模商业落地更具现实意义。成本优势也强化了其市场竞争力。Qwen3.5-Plus的API价格为每百万token 0.8元,较国际同类产品低约18倍。价格差距体现出国产模型在成本控制与产业链优化上的进展,有助于推动大模型在国内行业场景的更广泛应用。原生多模态训练能力表明了技术代际变化。不同于前代纯文本模型,千问3.5以视觉与文本混合token进行预训练,并显著增加中英文、多语言、STEM与推理相关训练数据,使模型获得更密集的世界知识与更强的推理能力。在视觉能力上,千问3.5在多项评测中取得领先结果,显示国产模型在多模态理解上已逼近国际一流水平。高效训练基础设施支撑了快速迭代。千问3.5的原生多模态训练在阿里云AI基础设施上完成,通过诸多基础技术改进,文本、图像、视频等混合数据的训练吞吐量接近纯文本基座训练水平;结合更精细的精度策略,激活内存减少约50%,训练速度提升10%,进一步压缩训练成本。智能体能力的扩展也带来更多落地场景。千问3.5可自主操作手机与电脑完成日常任务:移动端支持更多主流应用与指令,PC端可处理跨应用数据整理、自动化流程执行等多步骤任务。千问团队构建的可扩展Agent异步强化学习框架实现3到5倍端到端加速,插件式智能体支持规模扩展至百万级。国产大模型也在集体提速。近期字节跳动、MiniMax等企业相继发布新一代模型,国产大模型在“春节档”密集上新,表明国内AI产业进入更快迭代、竞争更直接的新阶段,各家通过技术突破与成本优化争夺市场空间。

密集发布的新模型不仅刷新技术指标,也折射出竞争逻辑的变化:从单纯比拼规模,转向比拼效率、成本与可用性;面向未来,开源生态、工程能力与治理体系将共同决定大模型能否成为可普及的新型基础设施。谁能在安全可控的前提下把能力沉淀为可用的生产力工具,谁就更可能在下一轮产业升级中占据主动。