中国信息通信研究院发布"方升"3.0基准测试体系 推动构建科学权威的人工智能评测生态

当前,全球人工智能技术快速发展,评测体系的科学性和权威性成为推动技术落地和产业升级的关键。

然而,评测标准不统一、技术验证不足、国际话语权较弱等问题制约着我国人工智能产业的进一步发展。

这一问题的产生源于多方面的原因。

首先,人工智能技术迭代迅速,评测体系需要不断更新以适应新需求;其次,行业应用场景复杂多样,单一评测标准难以覆盖全领域;此外,国际竞争加剧,建立自主可控的评测体系成为提升产业竞争力的重要抓手。

在此背景下,"方升"智测研讨会的召开具有重要意义。

石景山园管委会区科委主任高延娜指出,石景山区已构建现代化产业体系,2025年地区生产总值达1379.4亿元,其中软件和信息技术服务业增长显著,为人工智能发展提供了坚实基础。

中国信通院副院长魏亮强调,构建统一、科学的评测体系对技术创新和国际话语权提升至关重要。

会议期间,各方就人工智能评测体系建设提出了多项对策。

中国信通院研发的"方升"评测体系已完成3.0版本升级,形成覆盖基础属性、通用能力、行业应用等多维度的评测框架。

同时,产学研各界将深化协同,共建开放的人工智能评测生态。

展望未来,随着评测体系的不断完善,我国在该领域的发展前景广阔。

一方面,标准化的评测将加速技术成果转化,推动人工智能在各行业的深度应用;另一方面,自主评测体系的建立将增强我国在国际人工智能领域的话语权,为产业高质量发展提供支撑。

人工智能竞争的下半场,既比拼模型能力,也比拼标准、数据与治理体系的成熟度。

以科学、统一、可信的评测体系为牵引,把技术创新与产业实践联结起来,才能让大模型在更多关键领域“用得上、用得好、用得安全”,为高质量发展提供更坚实的数字底座与制度支撑。