话说 OpenAI 这回直接把 NVIDIA-Groq 推出来的这颗芯片的最大客户身份给锁定了,这可是要用掉整整 3GW 的专用“推理算力”呢。这波合作不光是继续搞那个叫 Vera Rubin 的项目,更是要靠 NVIDIA-Groq 的新方案来供货。现在 OpenAI 正跟好多做 AI 基础设施的伙伴谈融资呢,不久前刚宣布搞了个 1100 亿美元的大动作,主要是 NVIDIA、SoftBank 和亚马逊这几家在带头投钱。OpenAI 自己也说了,这就是为了维持发展势头,顺便把算力资源给弄够。《华尔街日报》还爆料说,NVIDIA 打算在今年的 GTC 大会上专门秀一下这款以 Groq 为核心的“处理器”,之前咱们也提到过这个事儿。说到底,就是 OpenAI 会成那个新方案的最大客户之一,这事儿挺让人意外的。其实 NVIDIA 那边已经说过了,他们给 OpenAI 准备了 3GW 的“专用推理算力”,这玩意大概率就是今年 3 月要在 GTC 上亮相的新东西。以前的报道说过,推理能力是 OpenAI 最近头疼的一个问题,他们对 NVIDIA 以前提供的那些方案其实不太满意。据知情人士透露,OpenAI 已经点头同意做这款新处理器的最大客户之一了,这对英伟达来说绝对是个大胜利。作为英伟达的大客户之一,ChatGPT 背后的这家公司前几个月一直在找比英伟达芯片更高效的替代品。据《华尔街日报》报,OpenAI 之前确实跟 Cerebras 和 Groq 谈过合作,想给那些对延迟特别敏感的任务提供更好的性能。但现在看来他们好像还是铁了心要跟 NVIDIA 死磕到底了。这很可能说明 NVIDIA 这次基于 Groq 搞的那个 LPU 做成的解决方案确实太有前景了,直接让 OpenAI 答应用 3GW 的算力去砸场子。至于这两家合作能出啥成果,最大的可能就是搞出个混合计算托架配置的那种配置来,就跟咱们之前聊的一样。现在看来,NVIDIA 今年在 GTC 上肯定会有大招要放,重点肯定是要围绕着 Vera Rubin 项目,说不定还能看到下一代的 Feynman 架构,当然还有那个围绕 Groq 打造的解决方案。