最新消息是,据 s-ss.cc 爆料,英伟达可能正在开发全新的 PCIe 扩展卡版本的 Hopper H100 GPU —— 但它并未配备 80GB HBM2e VRAM、而是增加到了 120GB 。
消息称这张新卡配备了六个 HBM2e 堆栈、拥有 6144-bit 总线位宽 @ 120GB VRAM、辅以 SXM5 同款 GH100 GPU 。
总计 16896 个 CUDA 核心、带宽超 3 TB/s、单精度性能 30 TFLOPS —— 与 SXM5 版本相当。
照此规格,英伟达 Hopper GH100 GPU 拥有 144 组 SM 流处理器 / 8 个 GPC —— 每组 GPC 包含 9 个 TPC,每 TPC 由 2 组 SM 单元组成。
每组 SM 单元最多由 128 个 FP32 单元,那样满血版应该是 18432 个 CUDA 核心。
GH100 GPU 完整规格参考:
● 每颗 GPU 拥有 8 GPC、72 TPCs(9 TPC / GPC)、2 SM / TPC、144 SM 单元
● 每组 SM 单元拥有 128 个 FP32 CUDA 核心,每颗 GPU 拥有 18432 个 FP32 CUDA 核心。
● 每组 SM 单元拥有 4 个第四代张量核心,每颗 GPU 拥有完整 576 个 Tensor Cores 。
● 6 组 HBM3 或 HBM2e 显存堆栈,辅以 12 个 @ 512-bit 显存控制器。
● 配备 60 MB 二级缓存
以下是 SXM5 外形的 NVIDIA H100 GPU 规格:
● 每颗 GPU 拥有 8 GPC / 66 TPC、2 SM / TPC、132 SM 单元
● 每组 SM 单元拥有 128 个 FP32 CUDA 核心,每颗 GPU 拥有 16896 个 FP32 CUDA 核心。
● 每组 SM 单元拥有 4 个第四代张量核心,每颗 GPU 拥有 528 个 Tensor Cores 。
● 5 组 @ 80GB HBM3 显存堆栈,辅以 10 个 @ 512-bit 显存控制器。
● 配备 50MB 二级缓存
● 支持第四代 NVLink 和 PCIe 5.0
目前尚不清楚英伟达正在搞测试原型,还是酝酿推出 Hopper H100 GPU 的未来迭代。
不过该公司最近在 GTC 2022 大会上表示,Hopper GPU 现已全面投产,预计首批产品会在下月到来。
扫一扫
在手机上阅读