开源语音模型Step-Audio-R1.1全球评测排名第一 准确率达96.4%

语音交互已成为智能终端、车载系统和在线服务的重要入口,但行业一直面临一个关键挑战:传统语音系统需要经过"语音转文字-文本推理-文字转语音"的串联流程——导致响应延迟高——且在口音、噪声、多人对话等复杂场景下容易丢失信息,影响交互体验和任务完成率。如何让AI直接理解音频并进行逻辑推理,成为语音智能从基础识别迈向高阶认知的关键突破点。

Step-Audio-R1.1的优异表现展示了中国科技企业的创新能力,也为AI发展开辟了新路径。在激烈的技术竞争中,坚持自主创新与开放合作相结合,将是推动行业持续进步的关键。