\u200E
最新动态 一手掌握

GPU霸权终结?AI Agent驱动下,CPU正在成为算力新主角

时间: 2026-03-01 18:07作者: 潘星宇



当全球AI产业的焦点从大模型参数竞赛转向实际应用落地,一个全新的临界点正在到来——Agent生态的爆发式扩张。从Multi-Agent集群协作到“贾维斯”式个人助手,AI正在从被动的对话工具,进化为能够自主规划、执行、反思的智能体。这场变革不仅重新定义了人机交互的边界,更在深刻重塑整个计算体系的底层架构。

爱集微VIP频道近日上线由国金证券撰写的研究报告《AI进入新临界点》。本报告立足于2026年初AI Agent技术的最新进展,以详实数据和前沿技术分析,系统剖析了Agent生态扩张对底层硬件(CPU、存储)需求的深远影响,提出了“CPU可能比GPU更早成为瓶颈”“以存代算”等颠覆性观点,为理解AI从模型研发向实际应用迈进的关键转折提供了权威指引。

欢迎订阅爱集微VIP频道

核心洞察:Agent驱动下的算力重构与存储爆发

一、Agent生态爆发:AI产业进入新临界点

全球Agent生态正迎来爆炸式扩张,成为AI产业发展的核心新趋势。报告通过一系列量化案例揭示了这一趋势的强劲动能:

-Anthropic营收预测与Claude Code表现:预计2026年销售额将达180亿美元(较去年预测增长4倍),2027年达550亿美元;其AI编码助手Claude Code截至2025年11月年化收入已超10亿美元,占当时总年化收入的14%,总年化收入2025年底超过90亿美元。

-Kimi K2.5模型的Agent集群能力:最多可调度100个分身并行工作,可并行处理1500个步骤。典型案例显示,一次性投喂40篇心理学与AI论文,Agent集群自动完成阅读、角色分配、分章节撰写,最终生成几十页专业PDF综述。

-Clawdbot的爆发与形态创新:可接管个人终端几乎所有任务(清空收件箱、发邮件、管理日历、航班值机等),支持WhatsApp、Telegram等平台指令。这一AI助手带火苹果Macmini,谷歌AI产品负责人专门购买一台用于24小时运行;腾讯云、阿里云等已火速提供一键部署服务。

二、算力重构:CPU取代GPU成为第一瓶颈

报告提出重要观点:在Agent驱动的强化学习时代,CPU正取代GPU成为算力第一瓶颈。这一判断建立在四大技术逻辑之上:

逻辑一:Multi-Agent架构引发OS调度压力

Agent遵循“推理 → 执行 → 评估 → 反思”的循环机制,需在思考与行动间频繁切换,导致操作系统上下文切换和进程调度任务激增。同时,代码执行等操作需在隔离的云端沙盒中运行,沙盒的启动、运行与销毁完全依赖CPU算力。

逻辑二:长上下文场景下的KV Cache卸载对CPU的挑战

当上下文长度达8万token时,仅KV Cache就可能消耗数十GB显存,远超GPU HBM容量。业界采用KV Cache Offload技术将数据迁移至CPU内存或SSD,但CPU与GPU间通信带宽远低于GPU内部HBM带宽,且卸载过程需CPU承担繁重调度任务。NVIDIA在2025年9月明确将KV Cache卸载列为解决HBM瓶颈的关键手段。

逻辑三:高并发工具调用带来的CPU算力消耗

英特尔与佐治亚理工学院2025年11月论文《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》数据显示,在五大代表性Agent工作负载中,CPU端工具处理占总延迟的43.8%~90.6%,远高于GPU的LLM推理占比。

吞吐量饱和测试显示,在GPT-OSS-20B模型中,随着Batch Size增加,各Agent工作负载吞吐量增长放缓。以LangChain为例,Batch Size达128时,出现严重的CPU上下文切换瓶颈。能耗对比同样印证CPU角色转变:高并发下CPU能耗已接近GPU(LangChain负载下,Batch Size=128时AMD Threadripper CPU能耗1807 Joules,Nvidia B200 GPU为2307 Joules),表明CPU不再是低能耗配角,而是关键算力单元。

逻辑四:DeepSeek Engram架构推动“以存代算”

DeepSeek Engram架构实现大模型“计算”与“超大规模记忆”的解耦,将千亿参数表存储于CPU内存,仅产生低于3%的额外开销;叠加Anthropic的永久记忆技术,类Engram架构正推动“以存代算”需求提升,倒逼CPU配比与性能升级。这些创新揭示了一个清晰方向:AI产业正从算力堆砌转向系统级优化,CPU与存储的协同将成为下一阶段竞争的关键。

三、存储爆发:Agent规模化应用的核心刚需

Agent的规模化应用正驱动存储需求持续爆发。从技术层面看,LLM推理的Decode阶段以内存访问为主,将KV缓存卸载至NVMe SSD等共享存储,可实现跨节点快速恢复,避免重新预填充的高延迟。

Agentic AI对海量历史数据的持续访问需求,以及边缘端Agent部署带来的数据爆发,将成为存储行业长期增长的核心驱动力。

立即注册爱集微VIP账号

解锁报告全部内容

爱集微VIP频道:您的前沿技术雷达

在技术快速迭代、全球竞争格局瞬息万变的时代,拥有系统、权威、前瞻的信息来源是做出正确决策的前提。爱集微VIP频道致力于打造ICT产业的全球报告资源库,通过“行业报告”“集微咨询”“政策指引”三大板块,为您提供:

-超过2万份深度产业与技术研究报告,持续更新;

-每周新增数百篇前沿分析与技术解读,紧扣脉搏;

-覆盖技术演进、市场动态、产业链布局的多维信息体系。

我们坚持“信息普惠”原则,会员一次订阅即可访问全平台内容,无二次收费,无分级限制。

限时会员通道现已开启,为您的专业决策注入持续动能:

-首月体验价仅需9.9元,以最低成本,超值体验完整服务。

-月卡19.9元,灵活应对短期、高强度的信息需求。

-季卡54.9元,以稳定的节奏,持续把握产业脉搏。

-年卡199元,是长期主义者最具性价比的智囊伙伴。

注册爱集微VIP账号,VIP频道搜索“AI新临界点,AI Agent驱动下CPU正在成为算力新主角”即可进入报告库查看完整内容,深入理解Agent时代算力重构与存储爆发的核心逻辑,为您的战略决策注入权威洞察。