具体支持指令包括:AVX512F、AVX512DQ、AVX512IFMA、AVX512CD、AVX512BW、AVX512VL、AVX512BF16、AVX512VBMI、AVX512VBMI2、GFNI、AVX512VNNI、AVX512BITALG、AVX512VPOPCNTDQ。
即将在年底发布的同样Zen4架构的下一代霄龙9004系列,同样会为AMD的服务器、数据中心方案带来AVX-512指令集。
值得一提的是,同样是AVX-512指令集,Intel是完整的512-bit通道,AMD则砍到了256-bit,因此在执行512-bit的指令就需要拆分成两个256-bit指令,官方称这可以节省芯片面积,避免发热过大、性能降低。
诸多新指令中,VNNI、BF16是面向AI加速的,官方号称FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!
扫一扫
在手机上阅读