我国日均词元调用量突破140万亿 数据要素赋能人工智能产业加速发展新阶段

在第九届数字中国建设峰会相关发布会上,国家发展改革委党组成员、国家数据局局长刘烈宏介绍了我国数据资源建设和人工智能应用最新进展。

总体来看,高质量数据集建设已迈入规模化阶段,应用端需求迅速增长,形成了数据供给与智能应用相互促进的良性局面。

问题:我国人工智能快速发展对高质量数据供给提出更高要求,同时也引发对数据资源规模、质量和应用效率的关注。

此前,数据集分散、标准不一、开放共享不足等问题制约了应用场景深化。

原因:近年来,数字中国建设持续推进,各地各部门在数据资源整合、治理标准建设、数据安全合规等方面发力,推动高质量数据集供给不断扩大。

数据显示,截至2025年末,全国已建成高质量数据集超过10万个,总体量达到890PB,相当于国家图书馆数字资源总量的310倍,为大模型训练和行业应用提供了充足数据基础。

影响:数据供给的扩张与应用需求的跃升相互带动。

到今年3月,我国日均词元调用量超过140万亿,较2024年初的1000亿增长了1000多倍,较2025年底的100万亿在三个月内增加40%以上。

词元调用量的快速增长,反映出人工智能从“能对话”向“能决策执行”的智能体应用转变,产业竞争力明显提升。

“词元出海”成为产业能力增强的体现,显示中国企业在全球市场的影响力正不断扩大。

对策:面对数据与应用的快速扩张,需要进一步健全数据治理体系,加强数据要素市场化配置,完善跨领域数据共享机制,提升数据安全与隐私保护能力。

同时应持续优化算力与算法协同,推动行业高质量数据集建设向规范化、标准化、可复用方向发展,为产业应用提供稳定支撑。

前景:未来,数据要素价值释放将进一步加快,高质量数据供给与人工智能创新将形成更紧密互动。

随着数字中国建设进入纵深阶段,数据资源在政务服务、产业升级、公共治理等领域的作用将持续增强,推动我国人工智能产业向高端化、规模化、国际化迈进。

从高质量数据集规模扩容到词元调用量快速攀升,折射出我国数字化发展由“积累资源”向“释放价值”加速转变。

抓住数据要素这一关键变量,在提升供给质量的同时守牢安全底线、完善制度规则、做强应用牵引,才能把增长势能转化为长期动能,为数字中国建设注入更可持续、更高质量的发展动力。