说到国产的专用计算芯片,这次北大集成电路学院、人工智能研究院的孙仲研究员团队可是交出了一份让人眼前一亮的答卷。大家都知道,现在人工智能到处用,数据量爆炸增长,算力已经成了推动科技进步和产业升级的核心家伙事儿了。不管是精准的个性化推荐,还是复杂的图像识别,海量数据要实时处理,对底层硬件的要求高得不得了。传统基于冯·诺依曼架构的通用数字芯片,遇到这些特定的复杂任务,经常会碰到“存储墙”、“功耗墙”这些拦路虎,速度和能耗很难兼顾。大家都在想办法跳出老套路,寻求新的计算方式。 这个团队就在这个大背景下,抓住了模拟计算这个新兴方向,搞出了关键性的突破。他们把阻变存储器给用上了,搞出了全球第一款全模拟计算的专用芯片和求解器系统。这项研究成果还登上了国际顶刊《自然·通讯》。非负矩阵分解是机器学习和数据挖掘的核心技术,能从杂乱的数据里找出有用的模式。不过这个算法的运算量太大了,用传统数字芯片那种串行的计算方式,不仅慢还费电。 孙仲他们换了个路子,直接利用欧姆定律、基尔霍夫定律这种物理定律来做模拟计算。这种方法有个好处,就是存算一体、高度并行、本质上就省电。团队用阻变存储器搭建了求解电路,就像是给这个复杂的计算任务量身定做了一把钥匙。他们还自己琢磨出了电导补偿技术,解决了器件不完美带来的误差问题。这样核心步骤就能在模拟域里一步到位完成,大大节省了面积和能耗。 为了验证效果,团队搭建了原型系统做了各种测试。结果表明,这个芯片系统处理彩色图像分解任务时信噪比损失极低;在训练大规模电影推荐数据集时精度也很高。最关键的是在面对Netflix级别的超大规模模型训练时,整体速度比先进的GPU快了约12倍;而能效比更是有超过228倍的飞跃提升。 这个成果不光是性能指标的提高,更证明了模拟计算架构在处理现实问题上的可行性。未来的推荐系统和内容过滤系统响应速度和能效可能会有数量级的提升。从更长远看,这为我国在全球人工智能算力竞争中开辟了一条新路子。孙仲研究员也表示,这项成果展现了我国科研人员的创新能力。随着研究深入和产业化推进,这种基于新器件的专用架构有望在机器学习、生成式AI等领域发挥大作用,为打造自主可控、绿色高效的下一代基础设施贡献力量。