英伟达刷新DeepSeek V4推理纪录：单Token成本降至15

发布时间：2026-07-01 14:21

　　英伟达昨日发布博文，宣布在英伟达 Blackwell 平台上，通过优化全栈推理，相比较 DeepSeek V4 模型 1 个月前上线初期，

　　注：单 Token 成本指模型生成或处理单个 token 的成本指标，常用于比较不同硬件、软件栈或部署方式的推理成本表现。

　　英伟达在博文中表示已将单 Token 成本列为 AI 总拥有成本的核心指标，并表示针对 DeepSeek v4 模型，Blackwell 平台已将其降低至行业最低水平。

　　性能方面，英伟达通过分离式服务、大规模专家并行、基于 NVIDIA NVLink 的并行通信、NVFP4 精度以及多 token 预测等技术，叠加优化后，Blackwell 平台单 GPU 的 token 吞吐量最高可提升 20 倍。

上一篇：Open USD来势汹汹！暴跌后获William Blair力挺：市场对竞争风险反应过度

下一篇：长安汽车：阿维塔科技重新向香港联交所递交H股发行上市申请

排行

1华为通过Huawei Band 6更新了其入门级健身追

2英特尔希望在六到九个月内开始为汽车公

3微信支付分怎么先用后付款教你微信支付

4Google支持的印度快递应用程序Dunzo寻求1

5Redmi Smart TV X55使用评测

6微信手势密码在哪里设置

7谷歌否认传言取消了Pixel 5A 5G

8诺基亚宣布推出C，G和X系列的六款新智能

9苹果MacBook和iPad生产因供应短缺而延迟

10HMD Global今天将发布诺基亚手机

精选

水晶光电：光存储业务现阶段正处于量产

压缩软件WinRAR发布7.23版本，修复内存溢出

锐捷网络发预增，预计上半年归母净利润

华为MateBook Pro笔记本获HarmonyOS 6.1.0.130 S

首程控股7月2日斥资154.28万港元回购100万

快手：初始投资者同意向北京可灵注资

汇聚科技根据股份计划发行22万股

互太纺织7月2日斥资85万港元回购100万股

中国中冶截至6月末累计回购8573.16万股A股

“史上最严电池安全令”落地，长安汽车

依旧贵的卖得多：曝华为Pura X Max横阔折手

维昇药业-B盘中涨近30%背后：市场聚焦核

中国旺旺7月2日斥资569.58万港元回购180万

腾讯回应充值《王者荣耀》显示《洛克王

锦欣生殖7月2日耗资约493.97万港元回购2

英伟达推出全新扶持计划，以收益分成模

锚定AI供应链主航道神州控股上半年实干

比亚迪海洋网旗舰海豹08上市：插混、纯

腾景科技拟3500万元设立昆山子公司整合

雅高控股因“10并1”基准进行股份合并而

推荐

小米Mi 11 Lite正式发布5G和4G版本

Oppo展示了新的无线快速充电技术

微软正在测试将News and Interests feed集成到

三星Galaxy F62配备64MP四摄像头