AMD发布6nm MI210计算卡:64GB HBM2e显存、300W功耗

时间 • 2025-06-17 14:57:54
支持
In

AMD发布6nm MI210计算卡:64GB HBM2e显存、300W功耗

去年11月,AMD发布了CDNA2新架构的新一代加速计算卡InstinctMI250X、MI250,升级6nm工艺、2.5DMCM双芯整合封装、第三代InfinityFabric总线互连技术,集成最多14080个流处理器核心、880个矩阵核心、218GBHBM2e显存/内存

两款卡均采用OAM模块形态,现在终于增加了PCIe标准形态,型号“InstinctMI200”,支持PCIe4.0。

MI200回归单芯封装,规格、性能几乎完全就是MI250砍去一半:291亿个晶体管,104组计算单元,6656个流处理器核心,416个矩阵核心,4096-bit64GBHBM2e显存,三条InfinityLink互连总线(最多四块并行)。

核心频率还是1.7GHz,性能也正好减半,FP64/FP32矢量算力22.6TFlops,FP64/FP32矩阵算力45.3TFlops,FP16矩阵算力181TFlops,INT8矩阵算力181Tops。

显存频率也维持在3.2GHz,所以带宽减半1.6TB/s。

整卡功耗从560W降到了300W,采用单个EPS12V8针辅助供电接口,被动散热。

软件API支持OpenMP、OpenCL、HIP,计算框架支持TensorFlow、PyTorch、Kokkos、RAJA。

InstinctMI200PCIe已经出货,方案客户包括华硕、戴尔、超微、慧与、联想。

与此同时,AMD还发布了ROCm5开发套件,硬件新增支持InstinctMI200系列计算卡、RadeonPROW6800专业显卡,系统新增支持RedHatEnterpriseLinux8.5,商业ISV合作伙伴新增AnsysCascade、TempoQuest,不仅提高了开发者的可用性,还在各种关键负载中实现了更出色的性能。

ROCm5的应用程序支持还包括HPC、AI、机器学习应用程序,以及AMBER、Chroma、CP2K、GRID、GROMACs、LAAMPS、MILC、Mini-HAAC、NAMD、NAMD3.0、ONNX-RT、OpenMM、PyTorch、RELION、SPECFEM3DCartesian、SPECFEM3DGlobe、TensorFlow。