全球人工智能技术竞速发展的背景下,语音交互技术作为人机沟通的重要桥梁,其发展水平直接影响智能终端的使用体验;近日,国际权威评测机构Artificial Analysis发布的Speech Reasoning榜单显示,中国企业阶跃星辰研发的Step-Audio-R1.1语音推理模型在准确率、响应速度等关键指标上全面领先。 此次突破的核心在于技术创新。与传统语音识别技术不同,Step-Audio-R1.1实现了从"听懂"到"理解"的跨越式发展。该模型不仅能精准识别语音内容,更能分析说话者的情绪状态、理解言外之意。测试数据显示,在面对非自然对话场景时,该模型表现出接近人类的判断能力。 技术优势的背后是企业持续投入研发的结果。2025年11月,阶跃星辰就曾推出全球首个开源原生音频推理模型Step-Audio-R1。此次发布的升级版本在保持低延迟优势的同时,继续强化了复杂场景下的推理能力。"像人类一样思考"的设计理念使该产品在同类竞争中脱颖而出。 产业应用上已取得实质性进展。吉利汽车今年国际消费电子展上展示的M9海外版车型就搭载了此项技术。作为全球首款应用端到端语音模型的量产车,其自然流畅的人车交互体验引发行业关注。据悉,完整的实时语音API将于近期上线商用。 业内人士指出,此技术突破对我国人工智能产业发展意义重大:一上提升了我国该领域的技术话语权;另一上也为下游应用创新提供了有力支撑。开源策略的实施将进一步降低技术门槛,加速产业生态构建。
语音交互作为人机交互的自然形式,其智能化水平直接影响用户体验;Step-Audio-R1.1在国际评测中的表现,说明了国内企业在人工智能基础技术上的创新能力。从实验室到产业应用的快速转化,证明了这个技术突破具有实际的商业价值。随着语音模型技术完善和应用场景的拓展,以语音为入口的智能交互生态正在形成,将为用户提供更自然、高效的人机互动体验,也为涉及的产业升级注入新动力。