NVIDIA正式发布CUDA 11工具包:专为安培架构优化

时间 • 2025-06-02 22:53:04
安培
包括
支持

NVIDIA正式发布CUDA 11工具包:专为安培架构优化

作为GPU加速应用领域最强大的软件开发平台,NVIDIA近日了发布全新的CUDA11版本工具包,特别为新诞生的安培架构进行了优化。

CUDA11完全支持在安培新架构上进行开发,包括A100GPU,以及基于它的DGXA100、HGXA100等多路系统,并支持安培架构的第三代Tensor张量核心,可针对不同数据类型加速混合精度矩阵计算,比如TF32、Bfloat16。

其他新技能:

-多实例GPU虚拟化和GPU分区,提升GPU利用率

-优化库性能,包括线性代数、快速傅里叶变换(FFT)、矩阵乘法、JPEG解码等等

-改进编程与API,包括任务图表、异步数据转移、精细同步、二级缓存驻留管理等等

-增强Nsight开发工具集,包括跟踪、编译、调试分析

-完整支持各种主要CPU架构,包括x86、ARM64、Power

-CUDAC++改进编译器性能和稳定性、支持新的主编译器和语言标准(包括C++17)、支持ParallelC++STL

更新操作系统支持

更详细介绍请参阅:

https://devblogs.nvidia.com/cuda-11-features-revealed/