华裔科学家领衔构建AI安全评估新体系新型网络攻防模型引发行业关注

问题——前沿能力“跃迁”带来双刃剑效应近期，业界对一款仍处预览阶段的新模型关注度持续升温。测试信息显示，该模型网络安全场景中不仅能在真实代码库里定位漏洞，还可在多步骤任务中拼接出较完整的攻击链条，呈现一定的端到端执行能力。一旦被滥用，可能提升网络攻击的效率与规模，尤其会对关键业务系统、供应链软件和公共服务平台带来潜在风险。基于这些考虑，企业决定暂不对外公开完整能力，改为以“受控可用”的方式分发，避免先进能力在缺乏约束的情况下外溢。原因——传统评估与防护逻辑难以覆盖新能力边界业内人士指出，过去网络安全治理多沿着“发现漏洞—发布补丁—应急响应”的路径推进，节奏主要由人工分析和周期性修复决定。但当模型具备更强的漏洞挖掘、优先级判断和攻击路径规划能力时，传统评估体系容易暴露两类不足：一是现有测试用例与基准指标难以真实衡量前沿模型在复杂系统中的攻防表现；二是防御端如果仍以事后修补为主，可能出现“攻击速度快于修复速度”的结构性问题。鉴于此，一些机构开始推动以对抗式测试、动态防护和能力分级为核心的新框架，用于更清晰地划定模型风险区间。影响——攻防格局或被重塑，关键领域需提前加固从公开评测结论看，新模型在漏洞定位与利用能力上较前代有明显提升，并在受控环境中展示了对配置缺陷、隔离边界等问题的识别能力。这意味着，攻击者可能更容易把分散的薄弱点串联成可执行路径；同时，防守方也能借助同类能力更快发现隐蔽风险，实现“以攻促防”。但总体而言，这类能力的外部性更强：一旦扩散到缺乏监管的场景，可能对企业内网、公共云环境、浏览器生态和开源依赖链条造成更大冲击。对关键基础设施运营单位而言，威胁建模需要从“已知漏洞”扩展到“可能被快速挖掘的未知缺陷”，推动监测、隔离、权限与配置治理同步升级。对策——红队对抗、高强度复现实验与限域开放并行推进为应对风险，该企业组建专门的安全评测力量，采用“红队对抗”对模型开展压力测试。有关团队按网络安全、生物安全与自主系统等方向分组，模拟真实对抗条件，通过多副本并行测试扩大覆盖面，并在更极端情境下验证模型表现，进而对风险进行分级管理。同时，企业推出限域访问计划：在不全面开放能力的前提下，向关键行业与部分社区提供受控使用，优先满足防御侧需求，探索在可审计、可追踪、可撤回的条件下释放能力价值。相关合作还包括将模型能力转化为更自动化的漏洞扫描、风险排序与加固建议工具，帮助防御方把工作前移，在攻击发生前完成排查与修复。前景——安全治理将从“补丁中心”走向“动态防护+制度约束” 多方观点认为，前沿模型的能力增长可能呈非线性，安全治理必须跟随能力演进同步迭代：一上，要加快建立更贴近实战的评测基准与可公开复现的测试框架，形成行业对风险的共同认知；另一方面，要推动关键行业建设动态防护体系，包括持续资产梳理、配置基线治理、最小权限与分段隔离、异常行为检测与自动化响应等，降低“单点漏洞引发系统性失守”的概率。同时，围绕模型发布与使用的制度安排也会更关键，限域开放、分级准入、日志审计与责任追溯等机制，可能成为前沿能力走向产业应用的必要条件。

技术进步不断拓展网络空间的能力边界，也同步抬高治理门槛。用更严格的评估、更审慎的开放和更及时的防御能力建设来对冲风险，是大模型进入产业深水区必须回答的问题。把安全边界建在能力扩张之前，才能让创新更可控、应用更可信。

华裔科学家领衔构建AI安全评估新体系 新型网络攻防模型引发行业关注

华裔科学家领衔构建AI安全评估新体系新型网络攻防模型引发行业关注