安装DCGM

支持平台

产品

DCGM当前支持以下产品和环境:

  • 所有Kepler(K80)和更新的NVIDIA数据中心(以前是Tesla)GPU

  • DGX A100、HGX A100 上的 NVSwitch

  • 所有 Maxwell 和更新的非数据中心(例如 GeForce 或 Quadro)GPU (也就是说其实也可以用于家用游戏GPU)

  • CUDA 7.5+ 和 NVIDIA 驱动程序 R450+ 裸机和虚拟化(仅限PassThrough直通 ,即 IOMMU 技术实现 采用OVMF实现passthrough GPU和NVMe存储

备注

DGX A100( NVIDIA DGX系列 )、HGX A100 是NVIDIA 面向 人工智(AI)能和高性能计算(HPC) 推出的GPU产品,也就是 2022年美国政府禁止英伟达高端GPU对华销售 的产品。

Linux发行版

DCGM支持的Linux发行版和架构

Linux发行版

x86 (x86_64)

Arm64 (aarch64)

POWER (ppc64le)

Debian 11

X

RHEL 8.y/Rocky Linux 8.y

X

X

X

RHEL 9.y/Rocky Linux 9.y

X

X

RHEL/CentOS 7.y

X

SLES/OpenSUSE 15.y

X

X

Ubuntu 22.04 LTS

X

X

Ubuntu 20.04 LTS

X

X

Ubuntu 18.04 LTS

X

X

  • CentOS7安装:

    sudo yum config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo
    sudo yum clean expire-cache && sudo yum install -y datacenter-gpu-manager
    

参考