在AI Agent引爆Token消耗指数级跃升的背景下,3月18日,多家国内科技巨头对AI算力相关产品服务大幅提价。如何看待当前AI算力供需失衡的格局?请看机构最新研判。
3月18日,阿里云官网宣布因全球AI需求爆发、供应链成本上涨,将对AI算力、CPFS等服务价格进行调整。几乎同一时间,百度智能云亦发布调价公告,AI算力产品服务价格上调5%至30%。两大云厂商同日涨价,将算力供需矛盾的紧迫性推至台前。
机构分析,一方面,以OpenClaw为代表的AI Agent应用推动Token消耗从线性增长跃升至指数级跃升,一次任务动辄消耗数十万至百万级Token,推理算力需求正成为新的增长极。另一方面,英伟达在GTC大会上发布Vera Rubin(致敬天文学家薇拉·鲁宾)全新计算平台,首次100%采用液冷解决方案,并引入CPO(共封装光学)、LPU(语言处理单元)等技术,预示着AI算力基建的底层架构正在被重新定义。
从需求端看,AI Agent正带来推理算力的指数级激增。机构指出,智能体AI具备机器自主调用、长上下文记忆、多工具链协同等特点,使得推理侧需求不再由人类交互频次主导,而是进入“计划—执行—反馈—再规划”的自循环模式。IDC预测,到2030年全球活跃ai智能体将达22.16亿,年度Token消耗量有望从2025年的0.0005 Peta(数量级“拍”,即1015)Tokens激增至15.2万Peta Tokens,增长超3亿倍。在此背景下,阿里、百度等云厂商相继提价,既是成本压力的传导,也侧面印证了算力需求的旺盛程度。
从供给端看,英伟达新架构指明技术演进三大方向。黄仁勋在GTC大会上提出AI的“五层架构”——能源、芯片、基建、模型、应用,并明确智能体AI和物理AI将成为下一阶段增长点。为实现更高效率的推理性能,英伟达Rubin及Feynman(致敬物理学家理查德·费曼)计算平台聚焦三大技术变革:一是LPU,通过大容量SRAM显著提升推理端性能表现;二是CPO,通过高速互联降低信号传输时延,突破带宽与功耗瓶颈;三是液冷,Rubin平台首次100%采用液冷方案,在液冷模块内部做板级和背板式集成互联,以突破算力密度带来的散热极限。
国产算力链迎来替代加速与技术升级双重机遇。机构分析认为,受海外芯片供应不确定性影响,叠加推理侧对芯片性能要求相对较低,国产AI芯片正迎来宝贵窗口。华为昇腾、寒武纪、海光信息等厂商在单卡性能上加速追赶,并通过超节点架构创新与英伟达展开竞争。与此同时,技术路线的演进正在重构整个算力硬件生态:从可插拔模块到CPO/NPO,从传统风冷到液冷,从Scale-out(横向扩展)到Scale-up(纵向扩展)网络架构,每一个细分环节都孕育着新的投资机会。
聚焦算力基建三大核心赛道,机构建议重点关注以下方向:

一是国产算力芯片与硬件:推理算力需求爆发叠加自主可控趋势,国产芯片厂商有望快速放量;二是光通信与CPO产业链:从800G/1.6T可插拔模块到CPO/NPO技术演进,光互联环节价值持续提升。三是液冷与电源散热:Rubin平台100%液冷方案确立行业趋势,散热环节成为算力密度的关键瓶颈。四是PCB与高速铜缆:服务器主板及互联技术升级驱动价值重构。
风险提示:AI产业发展不及预期;技术迭代路径不确定性;供应链波动风险;地缘政治及贸易摩擦风险。以上内容综合自广发证券、申万宏源、山西证券、开源证券、中银国际等近期已公开的证券研究报告,不构成任何投资建议,敬请投资者注意投资风险。



发表评论
2026-03-19 08:28:49回复
2026-03-19 14:43:16回复
2026-03-19 17:09:46回复
2026-03-19 13:58:00回复
2026-03-19 19:06:57回复