在2021架构日活动期间,英特尔详细介绍了PonteVecchioA0的芯片设计。考虑到英特尔长期缺乏独立显卡方面的经验,PonteVecchio可算是该公司一项雄心勃勃的登月计划。现在看来,由RajaKoduri和MasoomaBhaiwala带领的这支开发团队,着实给我们带来了不少惊喜。
(图viaWCCFTech)
对于英特尔公司的投资者们来说,PonteVecchio有助于其在HPCGPU市场抢占更多的份额。
RajaKoduri手里拿着的,就是PonteVecchioA0芯片。
2021架构日活动期间,英特尔还坦承已扫清XeHPC架构上市前的最后一道障碍。
上图中的蓝色和绿色线条,分别指代了英特尔Xe和竞争对手(或许是英伟达)。随着PonteVecchio在2021年的横空出世,英特尔在HPCGPU领域也实现了重大的超越。
英特尔透露,在打造PonteVecchio的设计过程中,他们几乎对所有部分都进行了重新设计和重组。
据悉,PonteVecchio封装中包含了47块“瓦片”,且各个瓦片可能基于不同的代工厂(比如Intel自家或台积电)。
显然,这需要极高的封装工艺作为支撑,才能最终让PonteVecchio成为一个有“凝聚力”的整体。
Folsom团队已经测量了45TFLOPs的FP32吞吐量、5TBps的显存带宽、以及2TBps的连接带宽,以验证A0芯片的所有部分都如预期般正常工作,并且有望为图形领域的重大突破做出贡献。
以Resnet基准测试为例,英特尔已经证明了A0PonteVecchio芯片可打破世界纪录。
此外英特尔XeHPC将提供1个或2个堆栈设计,且XeLink链路将用于在多个子系统中连结PonteVecchio。
与XeHPG不同的是,PonteVecchioGPU中的XeHPC内核,拥有8个矢量引擎(512位)和8个矩阵引擎(4096位)。
很明显,英特尔似乎已经迈过了图形技术停滞不前的低谷,并在高性能图形计算领域迎来了突飞猛进般的重大进展。
值得一提的是,规划中的Aurora超算,也将使用该公司的PonteVecchioGPU加速卡。
该公司甚至搬出了一个AuroraBlade刀片组件,无数的AuroraBlade单元将可组合成为一个超算集群。