进迭时空发布全球首款符合RVA23规范的量产RISC-V芯片单芯片可运行800亿参数大模型

随着大模型应用从云端向边缘设备扩展，智能设备对低时延、低成本、强隐私的计算需求日益紧迫。如何用更开放的指令集架构构建高性能、可规模化的算力底座，成为产业的核心课题。进迭时空此次发布的K3芯片，以RVA23规范为指引，推动RISC-V从通用计算向人工智能和行业控制应用的高性能落地。端侧和行业场景在部署大模型时面临三大挑战。首先是算力与功耗的平衡，既要保证推理速度，又要适应有限的能耗和散热条件。其次是内存带宽和容量的瓶颈，大参数模型对数据吞吐提出更高要求。第三是软硬件生态的碎片化，模型格式、系统适配和工具链的成熟度直接影响开发周期和规模部署。特别是在机器人和工业控制等场景，实时性和智能性需要在同一芯片平台上协同实现，传统的外接加速器方案在体积、成本和系统复杂度上存在明显不足。这些问题的根源在于，随着模型参数增长和推理算子复杂化，单纯依赖通用CPU或单一加速器已难以兼顾通用任务和AI推理的综合性能。同时，行业应用对安全隔离和多任务并行的要求提高，芯片级虚拟化能力成为必要基础。K3在芯片层面实现了通用算力与AI算力的融合，在并行计算位宽、推理数据精度和虚拟化支持上进行了优化设计，以系统级方案提升端侧推理和行业控制的可用性。 K3的发布表达出几个值得关注的信号。其一，RISC-V高性能产品正从"能用"向"好用、可规模化"转变，与规范化演进相结合，有利于降低生态分裂风险。其二，端侧大模型成为芯片竞争的新焦点，单芯片支持更大规模参数模型的能力将影响智能终端、机器人和边缘服务器的产品形态。其三，芯片级虚拟化和多操作系统适配的强调表明，行业客户对"一芯多用、可管可控"的需求上升，工业、政企和边缘数据中心等领域可能形成更多应用需求。 K3的设计思路是通过软硬件协同降低部署门槛。硬件上，采用多核通用计算与AI算力单元的组合，配套高带宽内存方案，并为机器人控制提供实时计算子系统及车规、工控常用接口。软件上，推出针对芯片优化的系统方案，强调对主流模型生态和多种操作系统的兼容性，同时开放板级产品和参考设计，帮助开发者缩短从芯片到整机的工程周期。这种路径有助于将芯片性能转化为可复用平台能力，推动方案商、整机厂和行业客户围绕统一底座进行二次开发。 K3提出的本地推理能力、FP8精度推理和高并行计算等方向，符合端侧大模型"更快、更省、更安全"的发展趋势。但其市场表现取决于三个关键因素。一是量产和供货节奏能否按计划推进，特别是与2026年行业需求窗口的匹配度。二是工具链、编译器、驱动和算子库的完善程度，这决定了生态能否持续吸引开发者。三是机器人、边缘推理盒子、阵列服务器等典型应用场景能否形成规模化案例和稳定的商业闭环。随着RVA规范的演进和行业对自主可控、开放生态的重视，围绕RISC-V的高性能芯片竞争将更加聚焦于平台化能力和交付效率。

在全球科技竞争格局调整的背景下，K3芯片的发布展示了国内企业在芯片架构创新上的能力，为关键核心技术自主可控提供了新的实践路径。随着产品量产和应用落地，该突破有望重塑对应的领域的技术生态，为数字经济高质量发展注入新动能。

进迭时空发布全球首款符合RVA23规范的量产RISC-V芯片 单芯片可运行800亿参数大模型

进迭时空发布全球首款符合RVA23规范的量产RISC-V芯片单芯片可运行800亿参数大模型