传openai将为nvidia-groq 推出推理算力

话说 OpenAI 这回直接把 NVIDIA-Groq 推出来的这颗芯片的最大客户身份给锁定了，这可是要用掉整整 3GW 的专用“推理算力”呢。这波合作不光是继续搞那个叫 Vera Rubin 的项目，更是要靠 NVIDIA-Groq 的新方案来供货。现在 OpenAI 正跟好多做 AI 基础设施的伙伴谈融资呢，不久前刚宣布搞了个 1100 亿美元的大动作，主要是 NVIDIA、SoftBank 和亚马逊这几家在带头投钱。OpenAI 自己也说了，这就是为了维持发展势头，顺便把算力资源给弄够。《华尔街日报》还爆料说，NVIDIA 打算在今年的 GTC 大会上专门秀一下这款以 Groq 为核心的“处理器”，之前咱们也提到过这个事儿。说到底，就是 OpenAI 会成那个新方案的最大客户之一，这事儿挺让人意外的。其实 NVIDIA 那边已经说过了，他们给 OpenAI 准备了 3GW 的“专用推理算力”，这玩意大概率就是今年 3 月要在 GTC 上亮相的新东西。以前的报道说过，推理能力是 OpenAI 最近头疼的一个问题，他们对 NVIDIA 以前提供的那些方案其实不太满意。据知情人士透露，OpenAI 已经点头同意做这款新处理器的最大客户之一了，这对英伟达来说绝对是个大胜利。作为英伟达的大客户之一，ChatGPT 背后的这家公司前几个月一直在找比英伟达芯片更高效的替代品。据《华尔街日报》报，OpenAI 之前确实跟 Cerebras 和 Groq 谈过合作，想给那些对延迟特别敏感的任务提供更好的性能。但现在看来他们好像还是铁了心要跟 NVIDIA 死磕到底了。这很可能说明 NVIDIA 这次基于 Groq 搞的那个 LPU 做成的解决方案确实太有前景了，直接让 OpenAI 答应用 3GW 的算力去砸场子。至于这两家合作能出啥成果，最大的可能就是搞出个混合计算托架配置的那种配置来，就跟咱们之前聊的一样。现在看来，NVIDIA 今年在 GTC 上肯定会有大招要放，重点肯定是要围绕着 Vera Rubin 项目，说不定还能看到下一代的 Feynman 架构，当然还有那个围绕 Groq 打造的解决方案。