智通财经APP获悉,国海证券发布研报称,服务器CPU是AI算力与数据中心升级的核心受益环节,正进入存量升级+国产替代+模型迭代三重共振周期,或将迎来价值重估机会,维持对计算机行业“推荐”评级。CPU市场迎来超节点技术创新、AI推理需求及AI算力产业链景气共振等多重驱动,有望进入涨价周期。其中,中国市场CPU格局相较海外更为集中,供需关系或将更为紧张。
国海证券主要观点如下:
DeepSeek引入Engram模块或推升CPU内存需求
2026年1月12日,DeepSeek上传新论文,提出现有“混合专家模型”(MoE)之外的第二条提升模型效率的路径——“条件记忆”(Conditional Memory)。MoE解决了“如何高效计算”的问题,Engram架构试图解决“如何高效存储与提取知识”的难题:
(1)模型性能突破:DeepSeek设计实体模块Engram来实现字典检索,将自然语言处理(NLP)领域经典的N-gram(N元语法)模型转化为一种可学习的、基于哈希(Hash)的向量检索系统,该模块被嵌入Transformer的主干网络中,与MoE层并行或交替工作。
(2)高效基础设施设计:将Engram嵌入表完全存储在CPUDRAM中。当前硬件环境下,显存(HBM)是制约大模型规模的瓶颈。与MoE依赖运行时动态路由不同,Engram检索基于输入文本的确定性哈希,确定性使得“预取”(Prefetching)策略成为可能。该行认为,“查算分离”架构或将提升CPU在推理过程的协同与调度价值。
从HBM、DDR到CPU:AI算力的核心器件正被重新定义
CPU是计算机的“大脑中枢”,架构设计追求“通用性”——能够处理各种复杂逻辑、分支判断、串行任务,是支撑所有系统运行的基础,其核心特点是“少核心、高主频、强缓存”。CPU处理操作系统的指令,协调各个硬件组件的工作,包括内存管理、数据流控制和I/O操作。
CPU是超节点不可或缺的关键组。成英部伟分达Rubin系列DGX节点配置为1颗Vera CPU搭配2颗Rubin GPU,单台Vera Rubin NVL72机架包含72颗Vera Rubin GPU和36颗Vera CPU。中科曙光ScaleX640单柜由160颗CPU和640颗GPU构成。华为CloudMatrix384将384个昇腾910CNPU、192个鲲鹏CPU以及其他硬件组件集成到一个统一的超级节点中,并通过超高带宽、低延迟的统一总线(UB)网络互连。
AI推理在扩大HBM、DRAM需求的同时,也在提高了对CPU的要求。当GPU频繁访问DDR内存时,CPU的并发请求需求将增加,其对GPU和内存资源管理的要求也将提高。目前超节点架构中,CPU与GPU的数量比普遍是1:4或者1:2,该行认为未来该比例有望进一步加大。根据AMD预计:其人工智能服务器CPU市场预计将从2025年的约82亿美元增长到2030年的约300亿美元。
数据中心进入升级周期,CPU或迎增长新机遇
头部CPU厂商持续更新。在2026年CES上,AMD展示了即将推出的Venice系列服务器CPU。自EPYCRome以来,AMD一直使用封装的有机基板来连接CCD和I/O芯片,Venice或将采用更先进的封装方式,或将配备两个I/O芯片。根据超能网援引Video Cardz信息,最近Granite Rapids-WS旗舰型号Xeon 698X出现在Geek Bench数据库,主要规格信息包括拥有86核心172线程,睿频4.6GHz,配备336MB的L3缓存。
超大规模数据中心建设导致服务器CPU供应紧张。根据wccftech援引Keybanc信息,AMD和英特尔2026年服务器CPU库存均已售罄,其中大部分需求来自超大规模数据中心运营商,AMD和英特尔计划将服务器CPU价格上调至多15%,以确保供应稳定。超大规模数据中心已进入“升级周期”,CPU架构同样有较大替换需求。根据wccftech信息,预计2026年服务器CPU出货量就有望+25%。
相关公司
①CPU:海光信息、龙芯中科、中国长城(飞腾信息)、中科曙光(海光信息);②AI芯片:海光信息、寒武纪、沐曦股份、摩尔线程;③芯片互联:中科曙光、盛科通信、澜起科技、锐捷网络;④服务器:中科曙光、浪潮信息、华勤技术、紫光股份、工业富联、软通动力、神州数码、中兴通讯、中国长城。
风险提示:技术落地不及预期与替代风险,行业竞争加剧与议价权削弱风险,行业需求结构性波动风险,产能约束风险,政策与国际贸易风险,高端EDA工具及验证软件进口依赖风险。