Hot Chips 34大会史昂,Intel又公布了Ponte Vecchio GPU高性能计算卡的更多细节,包括性能数据。
Ponte Vecchio GPU基于全新的Xe HPC高性能计算架构,使用5种不同制造工艺(Intel 7和台积电N7/N5等)、多种封装技术,整合了多达47个不同计算模块,晶体管数量超1000亿个。
它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GB HBM2e高带宽内存,支持PCIe 5.0,可以四路甚至八路并联。
Intel给出的最新数据声称,Ponte Vecchio FP32单精度、FP64双精度性能可达52TFlops,TF3.2浮点性能可达419TFlops,BF16、PF16浮点性能可达839TFlops,INT8整数性能则可达1678Tops。
Data Parallel C++ (DPC++)测试项目中,Ponte Vecchio的性能相比于NVIDIA A100可以领先1.4-2.5倍。
另外,ExaSMR OpenMC计算性能可领先2倍,NekRS性能则领先0.3-1.7倍。
Ponte Vecchio的使命是将联合下一代可扩展至强Sapphire Rapids,用于美国的首批三台百亿亿次超算之一Aorura,但不幸的是,Sapphire Rapids一再推迟,预计明年第二季度才能发布,Ponte Vecchio也一直没有量产上市。
相比之下,AMD三代霄龙处理器、Instinct MI250X加速卡组成的Frontier已经上线运行,并以1.6EFlops的性能,成为当今(公开的)超算之王。