蚂蚁开源发布万亿参数即时模型在复杂推理和指令遵循上实现突破

当前，大模型应用正面临新的挑战：从基础功能实现转向规模化、稳定性和成本控制。随着长文档理解、代码协作和跨资料推理等场景需求增长，对上下文长度的要求越来越高；同时，推理成本和响应速度仍是阻碍大模型广泛应用的主要瓶颈。如何性能、效率和可控性之间找到最佳平衡点，成为行业发展的关键课题。为此，蚂蚁集团开源了Ling-2.5-1T大模型。该模型总参数规模达万亿级，推理时激活参数为63B，预训练语料规模较前代有所扩大。其技术创新主要体现在两上：一是采用混合线性注意力架构和数据策略优化，提升长上下文处理的吞吐量和稳定性，最高可支持百万级token处理；二是引入"正确性+过程冗余"的复合奖励机制，保证结果可信度的同时保留完整推理过程，以相近的计算成本缩小与更高端模型的差距。此外，模型还采用了双向反馈强化学习和智能体指令约束校验等技术，增强了指令遵循、创意写作等能力，提升了工具调用和智能体交互的实用性。该开源模型的发布具有多重意义：首先降低了中小企业获取先进AI能力的门槛，促进"模型-工具-应用"的协同创新；其次，百万级上下文处理能力有望提升金融风控、合规审查等场景的工作效率；再次，高效的设计为算力有限的部署环境提供了新选择；最后，强化对齐机制为模型在企业场景中的应用打下了更好基础。但也要注意到，模型能力的提升并不意味着风险的消除。长上下文处理可能带来信息源更杂的问题，需要完善的知识管理和事实核验机制；工具调用能力的增强也对安全治理提出了更高要求。开源虽带来便利，但也需要开发者和使用者更加重视合规和安全问题。为推动产业落地，建议从三上着手：建立面向实际业务场景的评测体系；完善应用侧的数据接入、知识库引用等治理规范；加强开源生态建设，提升工程化水平。业内人士指出，未来大模型发展将聚焦两个方向：长上下文处理能力和token效率将成为核心竞争力；偏好对齐和工具调用能力将直接影响生产流程的可行性。随着开源生态的发展，模型能力将更快转化为生产力，但真正规模化应用仍需算力成本、工程成熟度和数据治理各方面的共同提升。

Ling-2.5-1T的发布标志着我国人工智能自主创新取得新进展；在全球科技竞争日益激烈的形势下，加强核心技术攻关和产学研协同创新至关重要。未来随着更多原创技术的突破，我国有望在全球人工智能领域发挥更大作用。

蚂蚁开源发布万亿参数即时模型 在复杂推理和指令遵循上实现突破

蚂蚁开源发布万亿参数即时模型在复杂推理和指令遵循上实现突破