英特尔详解Ponte Vecchio Xe HPC GPU A0芯片设计

在2021架构日活动期间，英特尔详细介绍了PonteVecchioA0的芯片设计。考虑到英特尔长期缺乏独立显卡方面的经验，PonteVecchio可算是该公司一项雄心勃勃的登月计划。现在看来，由RajaKoduri和MasoomaBhaiwala带领的这支开发团队，着实给我们带来了不少惊喜。

（图viaWCCFTech）

对于英特尔公司的投资者们来说，PonteVecchio有助于其在HPCGPU市场抢占更多的份额。

RajaKoduri手里拿着的，就是PonteVecchioA0芯片。

2021架构日活动期间，英特尔还坦承已扫清XeHPC架构上市前的最后一道障碍。

上图中的蓝色和绿色线条，分别指代了英特尔Xe和竞争对手（或许是英伟达）。随着PonteVecchio在2021年的横空出世，英特尔在HPCGPU领域也实现了重大的超越。

英特尔透露，在打造PonteVecchio的设计过程中，他们几乎对所有部分都进行了重新设计和重组。

据悉，PonteVecchio封装中包含了47块“瓦片”，且各个瓦片可能基于不同的代工厂（比如Intel自家或台积电）。

显然，这需要极高的封装工艺作为支撑，才能最终让PonteVecchio成为一个有“凝聚力”的整体。

Folsom团队已经测量了45TFLOPs的FP32吞吐量、5TBps的显存带宽、以及2TBps的连接带宽，以验证A0芯片的所有部分都如预期般正常工作，并且有望为图形领域的重大突破做出贡献。

以Resnet基准测试为例，英特尔已经证明了A0PonteVecchio芯片可打破世界纪录。

此外英特尔XeHPC将提供1个或2个堆栈设计，且XeLink链路将用于在多个子系统中连结PonteVecchio。

与XeHPG不同的是，PonteVecchioGPU中的XeHPC内核，拥有8个矢量引擎（512位）和8个矩阵引擎（4096位）。

很明显，英特尔似乎已经迈过了图形技术停滞不前的低谷，并在高性能图形计算领域迎来了突飞猛进般的重大进展。

值得一提的是，规划中的Aurora超算，也将使用该公司的PonteVecchioGPU加速卡。

该公司甚至搬出了一个AuroraBlade刀片组件，无数的AuroraBlade单元将可组合成为一个超算集群。