最近上海在打造自主可控智能算力方面动作频频,绿色集约和协同调度成了破解难题的关键。这场全球的AI竞争已经变成了看谁的算力更强,中国在这个领域的进步特别抢眼。埃隆·马斯克不是也说了嘛,中国在AI算力上会领先,现在本土的创新实践正好印证了这一点。以上海为代表的几个科技中心城市,把智能算力搞起来,规模和质量都很重要。 那天在“智算申城”高峰论坛上发布的信息显示,到2025年底,上海的智能算力规模已经突破120 EFLOPS,占到全国总量的8%,坐稳了国家算力网络的重要节点位置。更让人惊讶的是需求结构变了:以前大家都忙着模型训练,现在转向推理应用了。估计到2025年,训练需求占比会降到30%。随着AI智能体这些复杂应用落地,对算力的消耗可能比同参数的大语言模型还多十倍呢,推理需求的增长肯定是指数级的。 不过规模扩张得快也有麻烦事:能耗、调度、自主可控这三个大关得挨个过。先说能耗关,上海现在有超过160座智算数据中心,去年用电量占到了全社会的3%,怎么管理好这些大户成了首要问题。然后是调度关,资源用得不对路,有些紧急的任务要排队等半天。最后是自主关,到2027年要把国产芯片占比提升到70%。国产芯片从能用变成好用、还能形成竞争力是关键。 上海面对挑战挺有办法的。第一是把绿色低碳当成硬规矩来念。市能效中心的人说,对2025年新建数据中心的PUE要求已经从1.3压到了1.25。技术上液冷代替了风冷,现在应用比例快到70%了。各数据中心也在深挖潜力:万国数据浦江利用余热供暖;临港还建了个海底数据中心样板,用海上风电和海水冷却技术探索极限能效。 第二是搭个智能调度网来优化资源。去年3月上线的统筹调度平台把上海仪电、三大运营商还有商汤、阿里、百度的算力资源都聚到了一起,还在跟新疆湖南等地的资源联通。中国电信临港智算中心响应电网调峰需求时,3分钟内就把任务搬到了湖北;中国联通和产研机构合作搞了次跨越1500公里的沪鲁两地国产异构GPU混合训练试验,证明跨域协同能力很强。 第三是筑牢自主生态圈去突破产业链难点。上海培养出了沐曦、壁仞这些有影响力的AI芯片设计企业好多都上市了;中芯国际这样的制造龙头是基石。中游的集成和服务环节也在积极做国产芯片的验证集群;还在搞光互连GPU超节点尝试用“光计算”代替“电计算”。下游应用场景多市场广;这样一整套布局下来上海具备了从研发到落地的能力。 上海智能算力发展得又快又好,背后是兼顾了规模效益、能源约束还有技术创新的一条路子。通过这三个方面的努力:加强绿色低碳约束、编织高效调度网、打造自主生态圈,上海给超大城市建高性能算力基础设施提供了个参考方案。这不仅是支撑本地人工智能和生物医药这些产业发展的需要,更是为了国家科技自立自强和参与全球竞争。以后随着推理需求爆发和应用深化,上海在智算领域的探索意义会越来越大。