英伟达向 OpenAI、Anthropic、SpaceX 与甲骨文交付首批 Vera CPU

英伟达近日正式开始向多家顶级人工智能公司交付首批 Vera CPU,标志着这款面向 Agentic AI 时代打造的全新数据中心处理器进入量产阶段。 作为 Grace 的继任者,Vera 被视为英伟达 Agentic AI 生态的下一篇章,将为公司开辟一个全新的数十亿美元级业务增长空间。 据介绍,V...
英伟达向 OpenAI、Anthropic、SpaceX 与甲骨文交付首批 Vera CPU
英伟达向 OpenAI、Anthropic、SpaceX 与甲骨文交付首批 Vera CPU

英伟达近日正式开始向多家顶级人工智能公司交付首批 Vera CPU,标志着这款面向 Agentic AI 时代打造的全新数据中心处理器进入量产阶段。 作为 Grace 的继任者,Vera 被视为英伟达 Agentic AI 生态的下一篇章,将为公司开辟一个全新的数十亿美元级业务增长空间。

据介绍,Vera 是英伟达首款为 Agentic AI 工作负载量身定制的自研 CPU,主要面向需要在大规模环境下运行智能体的 AI 实验室、云服务商以及企业客户。 官方定位显示,这颗芯片将重点承担智能体编排、工具调用(tool-calling)、强化学习(RL)训练与推理、数据分析、智能体沙箱环境管理以及长上下文状态管理等关键任务。

在规格方面,Vera 基于英伟达自研的新一代 Arm 架构 Olympus 打造,集成 88 个自定义核心,并通过 NVIDIA Spatial Multi-Threading 实现 176 线程并行能力。 芯片提供 1.8 TB/s 的 NVLink-C2C 一致性内存互连带宽,最高支持 1.5 TB 系统内存,是上一代 Grace 的 3 倍,同时借助 SoC 模组化 LPDDR5X 实现 1.2 TB/s 内存带宽,并支持机架级机密计算能力。 英伟达声称,在数据处理、压缩以及持续集成/持续交付(CI/CD)等关键任务上,Vera 相比 Grace 可实现约 2 倍性能提升,而在满载状态下的单核性能也提升约 50%,并维持极高的性能功耗比。

英伟达副总裁(负责超大规模与高性能计算业务)的 Ian Buck 亲自将首批 Vera CPU 机柜“送货上门”至四家核心伙伴,凸显这款产品在公司战略布局中的重要性。 首站是位于旧金山 SoMa 区的 Anthropic 办公室,随后 Vera 机柜被送达 OpenAI 位于 Mission Bay 的总部,第三站则是 SpaceXAI 在帕洛阿尔托的办公室,埃隆·马斯克在现场接过了硬件。 在周一,Buck 又造访甲骨文的 AI 客户卓越中心(AI Customer Excellence Center),向 Oracle Cloud 交付了首批 Vera 机架,实现了 Vera 在四家行业领军企业中的“首轮落地”。

英伟达方面表示,目前交付的这些机柜仅是未来几个季度大量出货中的“小试牛刀”。 随着 Agentic AI 概念升温,市场对 CPU 在智能体编排与推理侧的需求正在快速增长,而专为此类工作负载优化的 Vera 已经在行业内引发强烈兴趣。 就在上周,有消息称 CoreWeave、Meta 与阿里巴巴已经锁定 Vera 作为早期大客户,而此次完成首批交付的甲骨文同样位列早期采用者之中。

在产品路线图层面,Vera 不仅将作为独立 CPU 出货,还将成为英伟达下一代 Rubin 平台的核心组成部分。 Rubin 被定义为英伟达当前最先进的 AI 平台之一,目标峰值算力可达 50 PFLOPS,配合 Vera CPU 可在系统级实现比 Blackwell 时代更高的整体性能提升。 按计划,搭载 Vera 的 Rubin 平台将在本周下半段启动面向 AI 客户的首批发货,首批机架的量产也即将开始。

得益于对 LPDDR5X 内存的全面采用,Vera 单平台最高可扩展至 1.5 TB 内存,这也意味着在大规模部署后,全球 LPDDR5X DRAM 供应链将面临新一轮紧张局面。 分析指出,在未来几年内,Rubin 与 Vera 的大规模铺开可能会使数据中心对 LPDDR 系列内存的需求超过智能手机等传统消费类终端,从而重塑整个存储产业的产能分配格局。

在系统形态上,Vera 既会出现在面向推理与 Agentic AI 的独立 LPX 服务器中,也将担当 Rubin NVL72 机柜中的主机处理器角色,为 GPU 集群提供高带宽、低延迟的数据与控制平面支持。 英伟达称,通过 CPU 与 GPU 的深度协同设计,这一“极致协同(extreme co-design)平台”将大幅提升 Agentic AI 工作流的吞吐效率和资源利用率,让下一代智能体系统在推理速度、决策能力与能效之间取得新的平衡。

随着 Vera 正式进入量产阶段,而 Rubin 平台也即将在未来数月全面上线,英伟达在数据中心 CPU 与 AI 系统平台两个维度同时发力。 在 GPU 已经牢牢占据高端 AI 训练与推理市场主导地位的背景下,Vera 的推出被视为英伟达补齐“通用计算+智能体编排”短板、全面强攻 Agentic AI 时代的关键一步。

查看评论

来源: cnBeta全文版查看原文