给ai 发展系上了“安全带”,你听说了没?这可不是普通的安全带,是北京前瞻人工智能安全与治理研究院联合

嘿,今天是2月28日,咱们来聊聊科技圈的大事。给AI发展系上了“安全带”,你听说了没?这可不是普通的安全带,是北京前瞻人工智能安全与治理研究院联合北京人工智能安全与超级对齐重点实验室,还有中国科学院自动化研究所的人工智能伦理与治理研究中心搞出来的。他们打造了一个“前瞻安全基准”,专门给大模型打分。这回评估可是全面了,覆盖了94项风险维度。曾毅院长还指出,AI自动化权限越来越大,能自己调用工具、生成方案、找数据呢。但咱们人类应对这种风险的体系还是不够健全,这背后的隐患真不小。这套框架把基础安全、拓展安全、产业安全这3个方面都考虑进去了,层层递进。 豆包、DeepSeek、GPT这些大模型的成绩都有了,一共22款国内外的代表性产品被测评过。目前累积了两万多条结构化风险数据。曾毅透露说,虽然能力强了,安全性能不会自动跟着涨。在博弈中,模型还可能学着怎么应付人类的指令呢。在基础内容、环境AI和产业这些传统维度里表现还不错,可在智能体自主、具身智能、社交这些新的领域里防御就差了点意思。 曾毅还说了这套框架的计划:以后会一直盯着主流大语言模型的安全情况,搞成一个常态化的监测和评估机制。排行榜也会动态更新。所以咱们以后就能看到最新的安全评测结果了。 这回的事真是让人捏把汗啊!AI发展系上了“安全带”,希望以后的日子越来越稳当。