AI算力需求进入“2.0”时代！OpenAI拟斥资300亿美元采购推理算力，或将换取Cerebras 10%股权

　　据知情人士透露，OpenAI 已同意在未来三年内向芯片初创公司 Cerebras 支付超过 200 亿美元，以使用搭载该公司芯片的服务器。根据协议，这位 ChatGPT 的开发商还可能获得该公司的股权。

　　这一进展正值 OpenAI 试图在人工智能竞赛中保持领先地位并满足日益增长的需求之际。今年 1 月，该公司曾同意在三年内从 Cerebras 购买高达 750 兆瓦的计算能力，交易估值超过 100 亿美元。

　　知情人士透露的承诺金额已经超过了此前报道的 OpenAI 与该芯片制造商达成的协议。

　　该交易凸显了行业对运行“推理”所需算力的需求日益增长。目前，各家公司正竞相开发推理模型和应用，旨在推动 AI 的更广泛采用。

　　报道称，总部位于加利福尼亚州桑尼维尔的 Cerebras 最快可能于周五披露此前未公开的与 OpenAI 协议的部分内容。

　　根据协议，OpenAI 将获得 Cerebras 的少数股权认股权证，其持股比例可能会随着支出的增加而上升。报道补充称，OpenAI 还同意向 Cerebras 提供约 10 亿美元，以帮助资助运行其 AI 产品的数据中心的建设。

　　报道还指出，OpenAI 未来三年的总支出可能达到 300 亿美元，这可能会转化为代表 Cerebras 高达 10% 股份的认股权证。

　　推理需求的爆发

　　在人工智能发展的早期，业界的目光大多聚焦在“训练”上。然而，随着OpenAI与Cerebras达成高达300亿美元的算力协议，一个明确的信号已经释放：AI行业的竞争重心正从“模型如何变聪明”转向“如何让聪明变得廉价”。

　　算力的主战场，正在向“推理”大规模迁徙。

　　行业数据显示，到2026年，推理带来的算力增量占比将达到三分之二，未来更将超过80%。增长速度同样惊人，根据OpenRouter最新数据测算，仅4月初一周内，全球AI大模型总调用量就达到27万亿Token，环比增长18.9%，其中中国AI大模型周调用量达12.96万亿Token，连续五周超越美国。

　　与此同时，推理的门槛也在快速下降。斯坦福2025人工智能指数报告显示，达到GPT-3.5同等性能的推理成本在两年内下降了280倍。需求在爆发，成本在骤降，两股力量叠加，正在为AI的规模化应用铺平道路。

　　训练成本是固定的、可预测的资本开支。但随着用户量破亿，每一次ChatGPT的回答、每一段的生成都在产生实时费用。这种运营成本随着用户增长呈线性上升。

　　专家预测，未来AI产业90%以上的算力开销将发生在推理阶段。对于OpenAI这样的企业来说，如果不能把单次推理的成本压到极致，其商业模式的护城河将极其脆弱。

　　训练需要极强的通用性能，而推理更看重能效比和延迟。这给了一批像Cerebras、Groq这样的初创公司，以及各大云厂商自研芯片巨大的生存空间。

AI算力需求进入“2.0”时代！OpenAI拟斥资300亿美元采购推理算力，或将换取Cerebras 10%股权

排行

精选

推荐