安装DCGM¶
支持平台¶
产品¶
DCGM当前支持以下产品和环境:
所有Kepler(K80)和更新的NVIDIA数据中心(以前是Tesla)GPU
DGX A100、HGX A100 上的 NVSwitch
所有 Maxwell 和更新的非数据中心(例如 GeForce 或 Quadro)GPU (也就是说其实也可以用于家用游戏GPU)
CUDA 7.5+ 和 NVIDIA 驱动程序 R450+ 裸机和虚拟化(仅限PassThrough直通 ,即 IOMMU 技术实现 采用OVMF实现passthrough GPU和NVMe存储 )
备注
DGX A100( NVIDIA DGX系列 )、HGX A100 是NVIDIA 面向 人工智(AI)能和高性能计算(HPC) 推出的GPU产品,也就是 2022年美国政府禁止英伟达高端GPU对华销售 的产品。
Linux发行版¶
Linux发行版 |
x86 (x86_64) |
Arm64 (aarch64) |
POWER (ppc64le) |
---|---|---|---|
Debian 11 |
X |
||
RHEL 8.y/Rocky Linux 8.y |
X |
X |
X |
RHEL 9.y/Rocky Linux 9.y |
X |
X |
|
RHEL/CentOS 7.y |
X |
||
SLES/OpenSUSE 15.y |
X |
X |
|
Ubuntu 22.04 LTS |
X |
X |
|
Ubuntu 20.04 LTS |
X |
X |
|
Ubuntu 18.04 LTS |
X |
X |
CentOS7安装:
sudo yum config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo sudo yum clean expire-cache && sudo yum install -y datacenter-gpu-manager