“前瞻安全基准”发布人工智能安全评估体系

各位好，我是新京报贝壳财经的罗亦丹。2月28日，北京前瞻人工智能安全与治理研究院（Beijing-AISI）给大家带来了一个好消息。他们联合人工智能安全与超级对齐北京市重点实验室，还有中国科学院自动化研究所人工智能伦理与治理研究中心，共同给大家提出并发布了一套新的人工智能安全评估体系。这个评估体系的名字是“前瞻安全基准（ForesightSafety Bench）”。 “前瞻安全基准”这个项目可厉害着呢，它是基于“AI安全”这个理念建立起来的。这套体系把AI安全分成了基础安全、拓展安全和产业安全三个大类别。每一个类别下面又细分出了很多风险维度，一共加起来有7大类基础安全风险，5大类拓展安全支柱，还有8大产业安全关键领域，总共覆盖了94项精细化的风险维度。光是为了评估这些风险数据，已经积累了数万条结构化的测评结果。而且呢，“前瞻安全基准”不仅可以评估智能体安全、具身智能安全、社会智能安全这些新近出现的安全隐患，还能应对失控和生存风险这些严重问题。这个评估体系可是相当系统化、层次化和广泛覆盖的。这意味着什么呢？就是它把我们目前能够想象到的所有人工智能可能会面临的问题都纳入到了考虑范围之内。最让人兴奋的是，“前瞻安全基准”上线的时候已经有22款代表性大模型接受了评估。未来，这个基准还会逐步开放更多模型给大家看。杰克·克拉克也对这次“前瞻安全基准”发表了他的看法。他是Anthropic联合创始人兼OpenAI前政策负责人。他觉得这个项目非常有意义。杰克·克拉克提到了一点：“现在大家都在讨论AI政策问题，可测量性是很多治理形式的前提。”虽然国家之间存在地缘政治分歧，“但是各国科学家们都在面对同一个课题——如何从社会相关层面评估他们系统的属性”。更让人高兴的是，“中国的研究者也在思考那些美国前沿实验室也担忧的生存性风险问题”。北京前瞻人工智能安全与治理研究院这次发布了“前瞻安全基准”，确实让大家看到了中国在这个领域的努力和进步。这个项目不仅展现了东西方在AI安全议题上的共识，也给我们提供了一个很好的工具去了解和改进我们现在使用的人工智能系统。