王江平呼吁构建中国特色人工智能治理体系以东方智慧应对技术风险

12月18日,南方都市报、南都数字经济治理研究中心在北京主办第九届啄木鸟数据治理论坛,聚焦人工智能安全边界与治理新秩序议题。

十四届全国政协委员、工业和信息化部原副部长王江平在主旨演讲中系统阐述"上善AI"治理理念,为当前国内外人工智能治理分歧提供东方视角的破解思路。

人工智能安全风险呈现新特征近年来,随着大语言模型快速迭代与产业应用深化,人工智能领域安全问题频发。

从生成式技术制造虚假信息,到仿冒名人实施网络诈骗,从换脸拟声技术滥用,到未成年人沉迷智能聊天工具,技术能力提升与安全边界模糊形成鲜明对比。

王江平在论坛上指出,大模型落地应用过程中,模型幻觉引发的内容风险日益突出。

自动驾驶、具身智能等技术发展,则将安全隐患延伸至物理世界。

智能体技术崛起后,内容生态风险、人机交互安全、行为安全风险愈发凸显,并可能对就业市场产生冲击。

据他分析,人工智能安全风险正经历从技术层面向经济社会稳定等宏观层面的传导过程,呈现出层级穿透态势,并通过生态系统加速扩散。

预计未来三至五年,该领域性风险将呈现更加多样化的表现形态。

技术突破与治理能力存在失衡当前人工智能系统正经历从技术工具向智能实体的深刻转变。

这一转变使其正负面影响均呈指数级扩大,但治理领域进展相对滞后。

王江平直言,人工智能治理发展速度明显落后于技术演进步伐,形成技术突破与治理能力的结构性失衡。

为应对这种失衡,人机对齐成为智能时代核心议题。

人机对齐是指通过技术手段与伦理框架,确保人工智能系统的目标、行为和输出与人类价值观、意图及社会规范保持一致。

目前该技术已在模型训练中得到广泛应用。

王江平介绍,主流模型普遍采用基于人工反馈的强化学习技术,将人类偏好转化为奖励信号,引导模型生成符合人类需求的内容。

检索增强生成技术则通过从预训练文档索引中检索信息,强化模型生成过程,提高输出准确性与可靠性,减少模型幻觉现象。

然而,人机对齐在实践中面临诸多挑战。

价值观的复杂性与动态性,使得为人工智能系统设定普适且可操作的价值目标函数极其困难。

数据偏差可能导致系统输出歧视性内容,部分企业出于成本考虑降低对齐水平。

王江平警示,若对齐速度跟不上技术发展,可能出现由技术领先者单方面定义人类价值观的风险,凸显治理与监管的重要性。

东方智慧提供治理新思路面对国际人工智能治理理念分歧加大、阵营化趋势明显的现状,王江平提出借鉴老子"上善若水"的东方智慧,构建人工智能治理新愿景。

他强调,国内人工智能监管需要建立科学敏捷的框架体系,在技术发展的激进态势与社会焦虑情绪之间寻求平衡。

2023年,英伟达首席执行官黄仁勋提出主权人工智能概念,强调各国需拥有自主基础设施以保护文化与经济安全。

此后该理念在科技与国际关系领域引发广泛讨论。

王江平认为,人工智能模型训练数据不可避免地包含特定国家与文化元素,在不同地区应用时会体现各自特色。

人工智能服务本国利益,离不开文化对齐这一核心问题。

文化对齐涵盖价值观、制度、哲学等基本范畴,也包括艺术、语言、习俗等具体层面。

这要求在技术发展过程中,既要把握通用性技术规律,又要充分考虑文化多样性与价值观差异,避免单一技术标准覆盖全球多元文化生态。

技术奔涌向前，治理必须同步跟进。

以“上善”之意观之，真正可持续的创新不在于一时的速度与规模，而在于能否在复杂现实中守住底线、增进信任、拓展公共福祉。

把对齐做深、把规则做实、把责任做细，才能让人工智能在可控可信的轨道上向善而行，为高质量发展提供更稳固的支撑。

王江平呼吁构建中国特色人工智能治理体系 以东方智慧应对技术风险