最近,人工智能界发生了一个大新闻。OpenAI公司放出了他们的新产品GPT-5.4,这个模型可厉害了,给AI办公时代拉开了序幕。它可以直接操作电脑,在办公软件和网页之间来回切换,很像人类在做这些事情。这回的测试显示,GPT-5.4在很多方面都表现得特别棒。比如,在基准测试中,它的GDPval胜率达到了83%,和顶尖的人类专家差不多。在编程方面,它在SWE-Bench Pro和FrontierMath这两项比赛中都拿到了第一名,可见它在编程能力上很强大。 最让人激动的是它的抽象推理能力。ARC-AGI-2这个测试中,它拿到了83.3%的成绩,超过了之前最好的成绩。这个模型还能识别界面元素,用鼠标键盘操作电脑呢。在实际使用中,它操作电脑的成功率达到了75%,比普通人还强呢。也就是说,发邮件、安排日程这些日常工作,AI都能自己搞定啦!这次发布的新模型整合了推理和编程能力,还能处理100万token这么长的上下文,用户还能随时干预调整。 GPT-5.4在知识工作上也表现得很好,像做专业文档或者数据分析这些任务都能做得很好。这次发布被认为是人工智能领域的一个里程碑事件。大家觉得这个模型会推动各行各业更快地应用AI技术,提高生产力呢。对于普通用户来说,这个AI助手会帮大家提升工作效率。未来也许AI会融入我们的日常生活,给我们的生活带来很大改变。