动向 | 英伟达推出ARM架构CPU，性能10倍领先

旺材芯片 | 2021-04-14 23:27:16 阅读：1782

还是熟悉的厨房、熟悉的皮衣，今天（4月13日）凌晨，NVIDIA GTC2021如约而至。NVIDIA创始人黄仁勋的主题演讲作为GTC的重头戏，果然没有让人失望，其在演讲中重磅发布了多款产品，其中三款基于Arm IP打造的处理器尤为引人关注：

NVIDIA Grace：专为大规模人工智能和高性能计算应用而设计
BlueField-3 DPU：首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU
NVIDIA DRIVE Atlan：新一代AI自动驾驶汽车处理器，算力将达到1000TOPS

英伟达CPU问世

GTC大会期间，黄仁勋在接受集微网电话采访时表示，英伟达收购Arm正在稳妥有序进行。尽管收购尚未尘埃落定，但英伟达已经开始了基于Arm IP的研发，打造了一款专为大规模人工智能和高性能计算应用而设计的CPU——NVIDIA Grace。

目前，绝大多数的数据中心仍将继续使用现有的CPU，而Grace主要将用于计算领域的细分市场。黄仁勋介绍道，“结合 GPU 和 DPU，Grace 为我们提供了第三种基础计算能力，并具备重新定义数据中心架构，推进 AI 前进的能力。”

Grace 的名字来自于计算机科学家、世界最早一批的程序员，也是最早的女性程序员之一的格蕾丝 · 赫柏（Grace Hopper）。她创造了现代第一个编译器 A-0 系统，以及第一个高级商用计算机程序语言「COBOL」。计算机术语「Debug」（调试）便是她在受到从电脑中驱除蛾子的启发而开始使用的，于是她也被冠以「Debug 之母」的称号。

Grace CPU是NVIDIA首次使用下一代 Arm Neoverse 内核的设计，采用了更为先进的 5nm 制程，在内部通信能力上，它使用了英伟达第四代 NVIDIA NVLink，在 CPU 和 GPU 之间提供高达 900 GB/s 的双向带宽，相比之前的产品提升了八倍。整个SoC是由多个芯片组合构成，它主要有三个部分，分别是CPU、GPU和内存/IO子系统。

Grace是一款高度专业化的处理器，主要解决工作负载问题，例如训练拥有超过1万亿个参数的下一代NLP模型。当与英伟达GPU紧密结合时，基于Grace CPU的系统将比当今最先进的基于英伟达DGX的系统（运行在x86 CPU上）的性能还要快10倍。

此外，Grace 还是第一个通过错误校正代码（ECC）等机制利用 LPDDR5x 内存系统提供服务器级可靠性的 CPU，同时提供 2 倍的内存带宽和高达 10 倍的能源效率。

对Grace的性能，黄仁勋如此总结道：“Grace能充分彰显出Arm的强大。”

虽然是首次出现在大众视野中，但目前Grace已经找到了至少两个客户——瑞士国家超级计算中心（CSCS）将采用Grace，构建一台名为Alps的超级计算机，其算力可达20Exaflops；美国洛斯阿拉莫斯国家实验室（Los Alamos National Laboratory）即将推出的超级计算机也将采用Grace。

三类芯片，逐年飞跃

在黄仁勋看来，CPU和GPU以及负责在数据中心传输和处理数据的数据处理单元（DPU），将共同组成“未来计算的三大支柱”。

GTC2021上，除了推出首款CPU“炸圈”外，英伟达的DPU同样值得关注。“我们每年都会发布激动人心的新品。三类芯片，逐年飞跃，一个架构。”黄仁勋说，数据中心路线图包括CPU、GPU和DPU这三类芯片，而Grace和BlueField是其中必不可少的关键组成部分。

英伟达全新推出的BlueField-3 DPU包含220亿个晶体管，采用16个Arm A78 CPU核心、18M IOPs弹性块存储，加密速度是上一代的4倍，并完全向下兼容BlueField-2。

据悉，BlueField-2能够卸载相当于30个CPU核的工作负载，而BlueField-3实现了10倍的加速计算性能提升，能够替代300个CPU核，以400Gbps的速率对网络流量进行保护、卸载和加速。该处理器也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。

此外，黄仁勋还发布了英伟达新一代AI自动驾驶汽车处理器——NVIDIA DRIVE Atlan，其算力将达到1000TOPS，约是上一代Orin处理器的4倍，超过了绝大多数L5无人驾驶出租车的总计算能力。

黄仁勋提出，“对于汽车而言，更高的算力意味着更加智能化，开发者们也能让产品更快迭代。TOPS就是新的马力。”

该SoC采用下一代GPU的体系结构、新型Arm CPU内核、新深度学习和计算机视觉加速器，并内置为先进的网络、存储和安全服务的BlueField DPU，网络速度可达400Gbps。同时，这也是DRIVE平台首次集成DPU，通过Arm核为自动驾驶汽车带来数据中心级的网络。

除了NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan这三款基于Arm IP打造的处理器外，黄仁勋还提到了AI-on-5G计算平台，这是一款专为边缘设计、将5G和AI相结合的新型计算平台，将采用NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100，将GPU和CPU组合成“有史以来最先进的PCIE卡。”目前，富士通、谷歌云、Mavenir、Radisys和Wind River等合作伙伴都在开发适用于NVIDIA AI-on-5G平台的解决方案。

布局Arm生态

在完成Arm收购后，英伟达将打造完整的数据中心芯片产品线，虽然收购案悬而未决，但在本次GTC大会上，NVIDIA仍宣布了一系列与Arm处理器设计商的合作进展，包括将为亚马逊AWS Graviton2 CPU提供GPU加速、为科学和AI应用开发提供支持的全新HPC开发者套件、提升边缘视频分析和安全功能、打造新一类基于Arm并搭载NVIDIA RTX GPU的新款PC等。

从自研三类芯片到GPU合作伙伴，从云、高性能计算、边缘计算到PC，不难看出英伟达对于Arm生态的重视程度。

为亚马逊AWS Graviton2 CPU提供GPU加速

2021年下半年，基于AWS Graviton2的Amazon EC2实例将与NVIDIA GPU相结合，在云端部署，可实现降低成本、支持更丰富的游戏串流体验、优化云上安卓游戏和人工智能推理、以更低成本提供更高的AI推理性能等优势。

为科学和AI应用开发提供支持的全新HPC开发者套件

NVIDIA全新HPC开发者套件为超级计算机提供了一个高性能、高能效的平台，该平台结合了1个Ampere Altra CPU（包含80个Arm Neoverse核，运行频率高达3.3GHz）、双NVIDIA A100 GPU（每个GPU可提供312TFLOPS的FP16深度学习性能）、两个用于加速网络、存储和安全的NVIDIA BlueField-2 DPU。

提升边缘视频分析和安全功能

NVIDIA正扩大与Marvell的合作，将基于Arm的OCTEON DPU与GPU相结合，加速AI工作负载，实现网络优化和安全。

打造新一类基于Arm并搭载NVIDIA RTX GPU的新款PC

NVIDIA将与联发科合作，共同打造一个采用Arm核与NVIDIA显卡、支持Chromium、Linux和NVIDIA SDK的参考平台，将GPU的性能及先进的AI、光线追踪图形等技术带入Arm PC平台。

写在最后

黄仁勋在NVIDIA GTC2021上公布了多项最新成果与研发进展，首款数据中心CPU的发布，也宣告着英伟达数据中心产品线正式集齐了“未来计算的三大支柱”——CPU、GPU、DPU，从英伟达在Arm身上“下的功夫”便不难看出其在CPU领域的野心。

英伟达每年在GTC大会上发布的新品已经成为了行业发展的重要指向，而正如黄仁勋所说，“新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。”不知今天过后，芯片圈的风向要怎么变呢？
来源：物联网智库

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。