当前,生成式AI技术正从实验室加速走向产业应用,但企业在部署AI系统时仍面临基础设施成本高、模型定制门槛高、合规要求复杂等多重挑战。作为全球领先的云计算服务商,亚马逊云科技正通过打通芯片、基础设施到应用平台的全栈能力,为企业级AI落地提供更系统的解决方案。 在基础设施层面,基于与NVIDIA超过15年的合作,亚马逊云科技推出搭载NVIDIA最新GB300 NVL72系统的Amazon EC2 P6E GB300实例,为特定AI工作负载提供更强的计算能力。更具代表性的动作是推出Amazon AI Factories:该私有云区域支持客户利用自身数据中心和电力资源,部署包括最新NVIDIA GPU、自研Amazon Trainium芯片、Amazon SageMaker AI训练推理平台以及Amazon Bedrock模型服务平台在内的AI基础设施,在满足数据安全与合规要求的同时,降低企业部署成本。 自研芯片战略是亚马逊云科技AI布局的重要支撑。Amazon Trainium已成为具备竞争力的训练与推理芯片,目前部署超过100万片,部署速度比前沿AI芯片快四倍。值得关注的是,Claude模型已实现100%在Amazon Trainium上运行,验证了该芯片在实际业务中的性能与稳定性。最新发布的Amazon Trainium3 UltraServer服务器中,核心芯片均为亚马逊云科技自研,包括Amazon Nitro、Amazon Graviton和Amazon Trainium,形成更自主可控的计算体系。下一代Amazon Trainium3及规划中的Amazon Trainium4也将更提升计算性能、内存带宽等关键指标,为企业提供更充足的算力支持。 在模型和应用层面,Amazon Bedrock作为模型推理平台,已集成18个开放权重模型,覆盖国际知名及中国头部模型开发商的产品。亚马逊云科技自研的Nova模型家族也推出多个版本,分别面向不同场景:Nova 2 Lite适用于日常工作负载,Nova 2 Pro面向更复杂工作场景,Nova 2 Sonic聚焦语音,Nova 2 Omni具备跨模态能力,可处理文本、图像等信息,并支持图像生成与编辑,以更贴近企业差异化需求。 企业级应用落地的关键之一在于模型定制能力。亚马逊云科技将模型定制能力分为三个层级。第一层是通过Amazon Bedrock进行的强化微调(RFT),重点在于降低使用门槛,即使没有算法背景的IT人员也可操作:用户选择模型、上传数据集并定义评估函数后,系统即可完成端到端微调;定制后的模型相较基础模型平均可提升66%的准确率。第二层是Amazon SageMaker AI提供的无服务器化模型定制能力,支持RLHF(人类反馈强化学习)、RLAIF(AI强化学习)以及DPO(直接偏好优化)等高级任务。第三层提供完全自动化与自助引导两种模式:既可通过自然语言完成从数据合成到模型评估的流程,也能在需要时为用户保留更多可控选项。分层设计对应不同企业的技术与资源条件,使从初创团队到大型企业都能选择合适的定制路径。 从市场表现看,亚马逊云科技2025年云服务收入超过1320亿美元,同比增长20%,其中AI对应的业务增长更为显著,反映企业对AI基础设施与应用平台的需求仍在上升。随着生态能力优化,亚马逊云科技正推动AI从技术概念走向可用生产力,加速生成式AI在金融、制造、医疗、零售等行业的落地应用。
生成式技术正在从“看得见的能力展示”走向“看得见的生产力”。谁能在算力底座、平台工具、模型生态与合规治理之间建立稳定的协同体系,谁就更可能在企业级智能体的规模化浪潮中占据先机。对产业而言,把技术进步转化为可控、可用、可持续的应用价值,仍需要在工程化细节与治理体系上持续投入。