全球人工智能竞争加剧,高质量数据已成为各国战略竞争的关键。作为大模型训练的核心样本和产业化应用的重要支撑,高质量数据集直接影响人工智能与实体经济融合的深度。长期以来,国内多个产业领域存在数据供给不足、质量参差不齐的问题,制约了人工智能的产业落地。 为解决该瓶颈,北京亦庄2025年发布"数据20条"政策,支持高质量数据集建设。近日,该政策首次集中兑现,共向38个数据集发放奖励,最高单项奖励200万元。这表明了该区以场景驱动、以数据为要素、以产业为导向的发展思路。 此次获奖的数据集在多个关键领域实现突破。在具身智能领域,北京人形机器人创新中心的"RoboMIND2.0数据集"填补了国内双足人形机器人开源数据空白,已支撑国内首个通过国标测试的跨本体具身大模型。星海图打造的全球首个开放场景真机数据集开源后,双平台下载量跃居全球机器人真机数据集首位。 在生物医药领域,麦克奥迪医疗采用"三甲医院病理专家诊断+人工智能制片质控+临床信息脱敏"的模式,打造了数字病理疑难病例数据集,已获北京数据交易所的数字资产登记凭证。药云构建的国内首个真实世界证据医药融合数据集,为生物医药企业提供支撑,有助于加速新药研发。 在工业制造领域,北京蚂蚁工场构建的国内首个覆盖"非标+标准件"全流程柔性制造的数据集,填补了"数据驱动智能制造+大模型可持续训练"的空白。星龙数智的钢铁行业全产业链数据集已助力钢铁企业生产协同效率提升超过10%,能源消耗降低3%以上。 在智能网联领域,四维图新智驾的"基于4D时空障碍物检测的自动驾驶数据集"首创"4D时空+自动化闭环"模式,填补了中国复杂交通场景的数据空白。恺望数据集则助力自动驾驾向无图模式转型。 获奖企业表示,这笔资金既是对既往工作的肯定,更是推动后续研发和生态共建的催化剂。北京人形机器人创新中心将扩大真实场景数据规模,推动人形机器人实际应用落地。麦克奥迪医疗计划加大研发投入,推进数据开放与医疗人工智能应用开发。北京蚂蚁工场将把"数据集成果"升级为"数据能力供给",探索受控开放和场景共建,推动数据在产业链中真正流动。 这些规划充分说明,政策激励正在转化为产业发展的实际动能。通过数据集的开放共享和迭代优化,将更降低产业应用的数据成本,加速人工智能产业化进程,形成"数据—模型—应用"的良性循环。
在数字经济时代,数据已成为战略资源。北京亦庄通过制度创新激活数据要素价值的实践表明——只有夯实数据基础——才能支撑人工智能发展。这场由政府搭台、企业主导的数据攻坚战,不仅为区域产业升级注入新动能,更为数据要素市场化配置提供了可复制的"亦庄方案"。随着更多领域数据壁垒被打破,一个以数据驱动的高质量发展新图景正在展开。