NVIDIA GPU核心和显存的主频控制

在构建 无风扇服务器构思 我除了考虑 采用 CPU频率 性能伸缩(Performance Scaling)powersave governor来降低CPU功耗,同时也想探索一下GPU主频的管理: (如果必要的话)

  • 查询GPU支持的核心主频和内存主频可以使用以下命令:

查询GPU支持的主频及内存主频组合
nvidia-smi --query-supported-clocks=timestamp,gpu_name,gpu_uuid,memory,graphics --format=csv

我的 Nvidia Tesla P10 GPU运算卡 GPU计算卡输出如下:

查询GPU支持的主频及内存主频组合,Tesla P10
timestamp, gpu_name, gpu_uuid, memory [MHz], graphics [MHz]
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 3008 MHz, 1531 MHz
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 3008 MHz, 1518 MHz
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 3008 MHz, 1506 MHz
...
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 3008 MHz, 569 MHz
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 3008 MHz, 556 MHz
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 3008 MHz, 544 MHz
2023/07/14 23:01:07.281, NVIDIA Graphics Device, GPU-794d1de5-b8c7-9b49-6fe3-f96f8fd98a19, 405 MHz, 544 MHz
  • 设置固定的core和memory主频:

设置主频
nvidia-smi --lock-gpu-clocks=<core_clock_rate>
nvidia-smi --lock-memory-clocks=<memory_clock_rate>
  • 重置主频:

重置主频
nvidia-smi --reset-gpu-clocks
nvidia-smi --reset-memory-clocks
  • 检查主频:

查询主频
nvidia-smi -q -d CLOCK

我的 Nvidia Tesla P10 GPU运算卡 输出信息:

查询主频输出, Tesla P10
==============NVSMI LOG==============

Timestamp                                 : Fri Jul 14 23:33:39 2023
Driver Version                            : 510.85.03
CUDA Version                              : Not Found

Attached GPUs                             : 1
GPU 00000000:82:00.0
    Clocks
        Graphics                          : 544 MHz
        SM                                : 544 MHz
        Memory                            : 405 MHz
        Video                             : 544 MHz
    Applications Clocks
        Graphics                          : 1025 MHz
        Memory                            : 3008 MHz
    Default Applications Clocks
        Graphics                          : 1025 MHz
        Memory                            : 3008 MHz
    Max Clocks
        Graphics                          : 1531 MHz
        SM                                : 1531 MHz
        Memory                            : 3008 MHz
        Video                             : 1544 MHz
    Max Customer Boost Clocks
        Graphics                          : 1531 MHz
    SM Clock Samples
        Duration                          : 118846.92 sec
        Number of Samples                 : 45
        Max                               : 1252 MHz
        Min                               : 544 MHz
        Avg                               : 703 MHz
    Memory Clock Samples
        Duration                          : 118846.92 sec
        Number of Samples                 : 45
        Max                               : 3008 MHz
        Min                               : 405 MHz
        Avg                               : 405 MHz
    Clock Policy
        Auto Boost                        : N/A
        Auto Boost Default                : N/A

参考