它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GB HBM2e高带宽内存,支持PCIe 5.0,可以四路甚至八路并联。
Intel给出的最新数据声称,Ponte Vecchio FP32单精度、FP64双精度性能可达52TFlops,TF3.2浮点性能可达419TFlops,BF16、PF16浮点性能可达839TFlops,INT8整数性能则可达1678Tops。
Data Parallel C++ (DPC++)测试项目中,Ponte Vecchio的性能相比于NVIDIA A100可以领先1.4-2.5倍。
另外,ExaSMR OpenMC计算性能可领先2倍,NekRS性能则领先0.3-1.7倍。
Ponte Vecchio的使命是将联合下一代可扩展至强Sapphire Rapids,用于美国的首批三台百亿亿次超算之一Aorura,但不幸的是,Sapphire Rapids一再推迟,预计明年第二季度才能发布,Ponte Vecchio也一直没有量产上市。
相比之下,AMD三代霄龙处理器、Instinct MI250X加速卡组成的Frontier已经上线运行,并以1.6EFlops的性能,成为当今(公开的)超算之王。
扫一扫
在手机上阅读