国金证券发布研报称,随着大模型从Chatbot向Agent演进,计算负载重心正发生偏移。Agent不仅需要GPU进行模型推理,更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。伴随Agent数量、任务复杂度与Token消耗指数级增长,CPU产业已进入新一轮景气周期,Intel、AMD服务器CPU库存趋紧、交期延长,并于2026年以来持续推进涨价。
国金证券主要观点如下:
随着大模型从Chatbot向Agent演进,计算负载重心正发生偏移。Agent不仅需要GPU进行模型推理,更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。国金证券认为,Agent对CPU的刚性需求主要来自三方面:1)Multi-Agent架构带来的OS调度压力,以及沙盒环境创建、调度与销毁对CPU算力的持续消耗;2)长上下文场景下KV Cache卸载对CPU内存与带宽提出更高要求;3)高并发工具调用带来的大量CPU算力消耗。Intel论文显示,多数Agent工作负载中,CPU耗时占端到端延迟比例可达40%-90%。
国金证券认为,伴随Agent数量、任务复杂度与Token消耗指数级增长,CPU产业已进入新一轮景气周期,Intel、AMD服务器CPU库存趋紧、交期延长,并于2026年以来持续推进涨价。
1)TAM来看,AMD与Arm均大幅上修服务器CPU市场空间,预计2030年全球服务器CPU TAM将超过1000亿美元。根据AMD,CPU需求可分为通用计算CPU、AI头节点CPU以及Agentic AI CPU三部分,其中智能体AI相关需求是最大的增量2)配比来看,AI数据中心CPU/GPU部署比例正从传统HGX时代的1:4、1:8,逐步向1:2、1:1甚至更高演进。以NVIDIA为例,GB300 NVL72已实现72颗GPU搭配36颗Grace CPU的1:2配比,Vera Rubin进一步通过外挂独立Vera CPU机柜,使整体CPU配比继续抬升。
1)ARM架构低功耗、高核心密度的特性更契合Agent工作负载。相比x86,ARM在高并发、低功耗场景下具备更优能效比与扩展能力,尤其适合海量API调用、KV Cache调度等轻计算、高并发任务。
2)ARM开放授权生态亦高度契合云厂商自主构建AI基础设施的需求,当前AWS Graviton、NVIDIA Grace、微软Cobalt等方案均已加速落地。ARM在FY26Q4业绩会上预计,到2030年按CPU类型划分的最大市场份额将属于Arm架构。
1)海外方面,Intel、AMD、Arm、NVIDIA等均围绕高核心密度、异构协同与能效优化展开新一轮产品迭代,CPU竞争正从单纯性能竞争迈向系统级算效竞争。
2)国内方面,海光、飞腾、龙芯、华为海思、熠知电子等厂商在x86、ARM与自主指令集方向持续突破,核心数、线程数、内存带宽与生态能力快速提升。伴随Agentic AI带来的CPU需求爆发,以及自主可控趋势深化,国产CPU有望迎来规模化替代与产业地位重估。
行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。










