亚马逊云科技推进企业级AI战略自研芯片与开放模型并行发展

当前，生成式AI技术正从实验室加速走向产业应用，但企业在部署AI系统时仍面临基础设施成本高、模型定制门槛高、合规要求复杂等多重挑战。作为全球领先的云计算服务商，亚马逊云科技正通过打通芯片、基础设施到应用平台的全栈能力，为企业级AI落地提供更系统的解决方案。在基础设施层面，基于与NVIDIA超过15年的合作，亚马逊云科技推出搭载NVIDIA最新GB300 NVL72系统的Amazon EC2 P6E GB300实例，为特定AI工作负载提供更强的计算能力。更具代表性的动作是推出Amazon AI Factories：该私有云区域支持客户利用自身数据中心和电力资源，部署包括最新NVIDIA GPU、自研Amazon Trainium芯片、Amazon SageMaker AI训练推理平台以及Amazon Bedrock模型服务平台在内的AI基础设施，在满足数据安全与合规要求的同时，降低企业部署成本。自研芯片战略是亚马逊云科技AI布局的重要支撑。Amazon Trainium已成为具备竞争力的训练与推理芯片，目前部署超过100万片，部署速度比前沿AI芯片快四倍。值得关注的是，Claude模型已实现100%在Amazon Trainium上运行，验证了该芯片在实际业务中的性能与稳定性。最新发布的Amazon Trainium3 UltraServer服务器中，核心芯片均为亚马逊云科技自研，包括Amazon Nitro、Amazon Graviton和Amazon Trainium，形成更自主可控的计算体系。下一代Amazon Trainium3及规划中的Amazon Trainium4也将更提升计算性能、内存带宽等关键指标，为企业提供更充足的算力支持。在模型和应用层面，Amazon Bedrock作为模型推理平台，已集成18个开放权重模型，覆盖国际知名及中国头部模型开发商的产品。亚马逊云科技自研的Nova模型家族也推出多个版本，分别面向不同场景：Nova 2 Lite适用于日常工作负载，Nova 2 Pro面向更复杂工作场景，Nova 2 Sonic聚焦语音，Nova 2 Omni具备跨模态能力，可处理文本、图像等信息，并支持图像生成与编辑，以更贴近企业差异化需求。企业级应用落地的关键之一在于模型定制能力。亚马逊云科技将模型定制能力分为三个层级。第一层是通过Amazon Bedrock进行的强化微调（RFT），重点在于降低使用门槛，即使没有算法背景的IT人员也可操作：用户选择模型、上传数据集并定义评估函数后，系统即可完成端到端微调；定制后的模型相较基础模型平均可提升66%的准确率。第二层是Amazon SageMaker AI提供的无服务器化模型定制能力，支持RLHF（人类反馈强化学习）、RLAIF（AI强化学习）以及DPO（直接偏好优化）等高级任务。第三层提供完全自动化与自助引导两种模式：既可通过自然语言完成从数据合成到模型评估的流程，也能在需要时为用户保留更多可控选项。分层设计对应不同企业的技术与资源条件，使从初创团队到大型企业都能选择合适的定制路径。从市场表现看，亚马逊云科技2025年云服务收入超过1320亿美元，同比增长20%，其中AI对应的业务增长更为显著，反映企业对AI基础设施与应用平台的需求仍在上升。随着生态能力优化，亚马逊云科技正推动AI从技术概念走向可用生产力，加速生成式AI在金融、制造、医疗、零售等行业的落地应用。

生成式技术正在从“看得见的能力展示”走向“看得见的生产力”。谁能在算力底座、平台工具、模型生态与合规治理之间建立稳定的协同体系，谁就更可能在企业级智能体的规模化浪潮中占据先机。对产业而言，把技术进步转化为可控、可用、可持续的应用价值，仍需要在工程化细节与治理体系上持续投入。

亚马逊云科技推进企业级AI战略 自研芯片与开放模型并行发展

亚马逊云科技推进企业级AI战略自研芯片与开放模型并行发展