传英伟达正在开发120GB HBM2e显存的Hopper H100 PCIe加速卡

最新消息是，据 s-ss.cc 爆料，英伟达可能正在开发全新的 PCIe 扩展卡版本的 Hopper H100 GPU —— 但它并未配备 80GB HBM2e VRAM、而是增加到了 120GB 。

消息称这张新卡配备了六个 HBM2e 堆栈、拥有 6144-bit 总线位宽 @ 120GB VRAM、辅以 SXM5 同款 GH100 GPU 。

总计 16896 个 CUDA 核心、带宽超 3 TB/s、单精度性能 30 TFLOPS —— 与 SXM5 版本相当。

照此规格，英伟达 Hopper GH100 GPU 拥有 144 组 SM 流处理器 / 8 个 GPC —— 每组 GPC 包含 9 个 TPC，每 TPC 由 2 组 SM 单元组成。

每组 SM 单元最多由 128 个 FP32 单元，那样满血版应该是 18432 个 CUDA 核心。

GH100 GPU 完整规格参考：

● 每颗 GPU 拥有 8 GPC、72 TPCs（9 TPC / GPC）、2 SM / TPC、144 SM 单元

● 每组 SM 单元拥有 128 个 FP32 CUDA 核心，每颗 GPU 拥有 18432 个 FP32 CUDA 核心。

● 每组 SM 单元拥有 4 个第四代张量核心，每颗 GPU 拥有完整 576 个 Tensor Cores 。

● 6 组 HBM3 或 HBM2e 显存堆栈，辅以 12 个 @ 512-bit 显存控制器。

● 配备 60 MB 二级缓存

以下是 SXM5 外形的 NVIDIA H100 GPU 规格：

● 每颗 GPU 拥有 8 GPC / 66 TPC、2 SM / TPC、132 SM 单元

● 每组 SM 单元拥有 128 个 FP32 CUDA 核心，每颗 GPU 拥有 16896 个 FP32 CUDA 核心。

● 每组 SM 单元拥有 4 个第四代张量核心，每颗 GPU 拥有 528 个 Tensor Cores 。

● 5 组 @ 80GB HBM3 显存堆栈，辅以 10 个 @ 512-bit 显存控制器。

● 配备 50MB 二级缓存

● 支持第四代 NVLink 和 PCIe 5.0

目前尚不清楚英伟达正在搞测试原型，还是酝酿推出 Hopper H100 GPU 的未来迭代。

不过该公司最近在 GTC 2022 大会上表示，Hopper GPU 现已全面投产，预计首批产品会在下月到来。