OpenAI刚刚把GPT-5.4这款大模型给推出来了,这是个蛮重要的里程碑,意味着AI朝着自主智能体又迈了一大步。周四的时候,OpenAI正式发布了这个最新一代的旗舰产品。按他们的说法,新模型在推理、写代码还有处理表格、文档这些专业办公活儿上都变强了,而且需要人反复交代的次数变少了。更厉害的是,这是OpenAI第一款能直接控制电脑的模型,它可以替你去点鼠标、敲键盘,把不同的程序串起来干活儿。这说明大家都在琢磨的那个“智能体未来”,这回算是又往前探了一步。大家心里都想着以后让这些AI智能体在后台自动跑,搞定各种复杂的线上和软件内的任务。 以前OpenAI就已经有ChatGPT Agent了,去年市场上也出来了不少类似的工具,它们能拿住你的电脑去干特定的活,比如帮你搜好食材再下单买回家。现在OpenAI打算把GPT-5.4给到他们的API接口还有那个编程工具Codex里。同时,他们还把推理模型GPT-5.4 Thinking装进了ChatGPT平台里。听说这模型不光会写代码去操作电脑,还能看图截图里的内容来发指令。 这玩意儿用浏览器、调工具和API帮忙办事的时候,准确率和效率都高了不少。尤其是对付那些要把好多乱七八糟的信息整合在一起的复杂问题,它表现得特别棒。OpenAI自己都说了,这是“目前事实性最强”的模型,单个说法出错的概率比之前的GPT-5.2还少了33%。 在ChatGPT内部呢,GPT-5.4 Thinking会给那些大问题列出个思路大纲来。用户在等回复的时候随时可以改改要求或者微调一下需求。不用重头再来对话或者多聊几轮了就能搞定预期的结果。这个功能现在网页版和安卓版都能用了,iOS版的“马上也要来了”。 现在GPT-5.4已经全面开放给ChatGPT、Codex还有API用了。其中那个思考模型就给Plus、Team和Pro这些付费用户去用。至于那种特别看重高性能的需求的“Pro版”,也会通过API的形式上线给企业版和Edu用户去用。 这几个月以来呀,OpenAI、Anthropic 还有别的那些做AI的厂家都在不停放新货。大家都说这些模型能帮着咱们干更宽的活儿。这能力其实是在前些年的工具帮着写代码和调代码的基础上进一步往外扩的。这种势头让不少传统软件公司的投资人心里发慌,因为总担心以后这些软件公司会被AI厂商给挤兑掉。