据知情人士透露,OpenAI 已同意在未来三年内向芯片初创公司 Cerebras 支付超过 200 亿美元,以使用搭载该公司芯片的服务器。根据协议,这位 ChatGPT 的开发商还可能获得该公司的股权。
这一进展正值 OpenAI 试图在人工智能竞赛中保持领先地位并满足日益增长的需求之际。今年 1 月,该公司曾同意在三年内从 Cerebras 购买高达 750 兆瓦的计算能力,交易估值超过 100 亿美元。
知情人士透露的承诺金额已经超过了此前报道的 OpenAI 与该芯片制造商达成的协议。
该交易凸显了行业对运行“推理”所需算力的需求日益增长。目前,各家公司正竞相开发推理模型和应用,旨在推动 AI 的更广泛采用。
报道称,总部位于加利福尼亚州桑尼维尔的 Cerebras 最快可能于周五披露此前未公开的与 OpenAI 协议的部分内容。
根据协议,OpenAI 将获得 Cerebras 的少数股权认股权证,其持股比例可能会随着支出的增加而上升。报道补充称,OpenAI 还同意向 Cerebras 提供约 10 亿美元,以帮助资助运行其 AI 产品的数据中心的建设。
报道还指出,OpenAI 未来三年的总支出可能达到 300 亿美元,这可能会转化为代表 Cerebras 高达 10% 股份的认股权证。
推理需求的爆发
在人工智能发展的早期,业界的目光大多聚焦在“训练”上。然而,随着OpenAI与Cerebras达成高达300亿美元的算力协议,一个明确的信号已经释放:AI行业的竞争重心正从“模型如何变聪明”转向“如何让聪明变得廉价”。
算力的主战场,正在向“推理”大规模迁徙。
行业数据显示,到2026年,推理带来的算力增量占比将达到三分之二,未来更将超过80%。增长速度同样惊人,根据OpenRouter最新数据测算,仅4月初一周内,全球AI大模型总调用量就达到27万亿Token,环比增长18.9%,其中中国AI大模型周调用量达12.96万亿Token,连续五周超越美国。
与此同时,推理的门槛也在快速下降。斯坦福2025人工智能指数报告显示,达到GPT-3.5同等性能的推理成本在两年内下降了280倍。需求在爆发,成本在骤降,两股力量叠加,正在为AI的规模化应用铺平道路。
训练成本是固定的、可预测的资本开支。但随着用户量破亿,每一次ChatGPT的回答、每一段的生成都在产生实时费用。这种运营成本随着用户增长呈线性上升。
专家预测,未来AI产业90%以上的算力开销将发生在推理阶段。对于OpenAI这样的企业来说,如果不能把单次推理的成本压到极致,其商业模式的护城河将极其脆弱。
训练需要极强的通用性能,而推理更看重能效比和延迟。这给了一批像Cerebras、Groq这样的初创公司,以及各大云厂商自研芯片巨大的生存空间。










