人工智能安全治理与创新发展如何并重?——专访清华大学专家朱军

问题:大模型“跑得快”,安全与就业焦虑同步上升 从年初新一轮模型能力跃升带动行业竞速,到网络上围绕“养龙虾”等智能体应用的讨论升温,再到个别平台曝光的“大模型投毒”等风险案例,人工智能正在更深度进入内容生产、办公协同、软件开发与服务业等场景。

随之而来的,一方面是企业降本增效与新业态涌现,另一方面是公众对“工作是否会被取代”、企业对“模型是否可信可控”的双重关切。

朱军认为,当前社会感受最明显的变化不在于单点技术,而在于大模型被快速产品化、工具化之后,对工作流程与决策方式产生的系统性冲击。

原因:技术迭代快、应用下沉深,安全短板更易暴露 业内人士指出,大模型能力提升依赖数据、算法与工程体系协同,迭代速度远超以往软件产品周期,应用从实验室走向商业化的门槛迅速降低。

朱军分析,“热潮”出现的背后有两点现实因素:其一,模型能力进入“可用区间”,在客服、文案、代码、短视频制作等场景能直接形成生产力;其二,产业链条长、参与主体多,数据来源、工具组件、开源依赖与第三方插件的复杂性显著上升,使得“投毒”、对抗样本、提示注入、数据泄露等风险更容易在实际部署时被放大。

尤其在早期阶段,部分机构更关注速度与规模,对系统级安全评估、红队测试、数据治理等投入不足,导致漏洞在热度上升时集中显现。

影响:岗位结构重组加速,内容产业与实体产业均受波及 围绕“替代”与“失业”的担忧,朱军表示应从生产工具演进的角度看待:技术确会改变分工,但更可能释放人力、提升个人能力边界。

对内容产业而言,多模态生成工具降低了创作门槛,个人可完成过去团队协作才能完成的部分流程,促使“一人工作室”“小团队高产出”增多;对企业而言,标准化、重复性较强的环节会更快被自动化改造,但对需求定义、创意策划、质量把关、合规审查、复杂协同等岗位的要求将同步提高。

与此同时,安全风险若处置不当,可能带来三类外溢影响:一是错误信息与有害内容传播加剧,损害平台公信力与社会信任;二是供应链安全风险向上游数据、下游行业应用扩散,影响生产经营;三是监管成本上升,若治理滞后可能形成“先扩张后补课”的高代价路径。

对策:坚持治理与发展并重,构建全链条“防投毒”体系 受访专家强调,安全不是发展的对立面,而是可持续创新的前提。

朱军建议从系统工程角度补齐短板:第一,数据端要强化来源可追溯、标注可审计、质量可评估,建立训练数据“准入清单”和敏感数据隔离机制,降低数据被污染与被滥用的概率。

第二,模型端要形成常态化评测与对抗测试机制,针对“投毒”与提示攻击建立基准测试集和红队流程,推动关键能力在上线前“可测、可控、可回滚”。

第三,应用端要落实分级权限、输出过滤、日志留痕与异常监测,对高风险场景设置“人机协同”的必要闸口,防止模型在关键决策中被诱导输出错误结论。

第四,产业端要完善标准与协同治理,推动平台、企业、研究机构与监管部门共同形成技术规范、合规指引与责任边界,减少“各自为战”导致的防护断层。

朱军判断,随着行业对风险的讨论持续升温,围绕智能体与大模型的系统级防护工具、检测服务与安全评测产业将加快形成,为应用落地提供“安全底座”。

前景:多模态与具身方向提速,关键变量在数据与场景闭环 谈及未来演化路径,朱军认为,大模型正从“生成内容”走向“理解环境、辅助决策并执行行动”,多模态能力提升将推动其更深嵌入生产流程。

相较早期语言模型的发展节奏,视频与多模态模型的迭代更快,说明在数据架构与算力条件具备时,能力提升会呈现加速度。

面向实体世界的具身智能被视为下一阶段重要方向,但其瓶颈往往在数据采集效率、场景多样性与闭环验证成本。

朱军表示,行业可通过高质量视频数据与仿真环境提升训练效率,同时以真实场景的小规模试点实现快速迭代。

可以预见的是,硬件、软件与软硬协同将带来新的岗位与产业链条,数据治理、模型评测、安全工程、行业知识运营等职业需求也将持续增长。

公众层面,更重要的是主动学习与适应,把新工具转化为个人能力的一部分,在变化中找到新的价值定位。

人工智能产业的发展已进入一个关键阶段,既充满机遇也面临挑战。

当前的核心任务是建立科学、有效的治理框架,既要防范系统性风险,也要给技术创新和产业应用留出足够的发展空间。

这不是一个非此即彼的选择题,而是需要在动态平衡中不断调整的过程。

从历史经验看,每一次重大技术变革都会带来社会结构的重组,关键是如何引导这种变革朝着更加包容、更加共享的方向发展。

对于个人而言,主动适应和学习新技术,将成为应对未来变化的必要条件。

对于社会而言,完善制度设计、优化资源配置,将是确保技术红利公平分享的重要保障。