安装NVIDIA Linux驱动(Ubuntu)

安装590驱动

我之前 安装NVIDIA Linux驱动 实践中采用了官方仓库方式安装。Ubuntu提供了一个简单工具来查看最适合自己显卡的驱动器版本:

使用Ubuntu提供的工具来查找最适合的驱动版本
ubuntu-drivers devices

输出显示中标记为 recommanded 就是最推荐的驱动版本:

使用Ubuntu提供的工具来查找最适合的驱动版本,可以看到最适合的版本是 590
...
== /sys/devices/pci0000:00/0000:00:03.0/0000:08:00.0 ==
modalias : pci:v000010DEd000025B6sv000010DEsd0000157Ebc03sc02i00
vendor   : NVIDIA Corporation
model    : GA107GL [A2 / A16]
driver   : nvidia-driver-580 - distro non-free
driver   : nvidia-driver-570-server - distro non-free
driver   : nvidia-driver-590-open - distro non-free recommended
driver   : nvidia-driver-590-server - distro non-free
driver   : nvidia-driver-535-server-open - distro non-free
driver   : nvidia-driver-590 - distro non-free
driver   : nvidia-driver-570-server-open - distro non-free
driver   : nvidia-driver-535-open - distro non-free
driver   : nvidia-driver-590-server-open - distro non-free
driver   : nvidia-driver-580-server - distro non-free
driver   : nvidia-driver-570-open - distro non-free
driver   : nvidia-driver-580-server-open - distro non-free
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-580-open - distro non-free
driver   : nvidia-driver-535 - distro non-free
driver   : nvidia-driver-535-server - distro non-free
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-570 - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

需要注意的是 590 有3个版本 open , serverserver-open :

  • nvidia-driver-590-open 是NVIDIA 近年来主推的新架构

    • 内核部分开源:驱动分为两部分,一部分是闭源的用户态库(CUDA、OpenGL),另一部分是开源的内核模块

    • 支持对象:仅支持 Turing (图灵) 架构及以后的架构( NVIDIA Tesla A2 GPU运算卡 是 Ampere 架构完全支持)

    • 优势:与 Linux 内核(尤其是 Ubuntu 24.04 的新内核)集成更好,符合现代 Linux 发行版的安全标准,支持一些仅限开源模块的高级功能(如 GSP 固件管理)

  • nvidia-driver-590-server 是服务器长期支持版

    • 稳定性优先:Server 版驱动不追求最新的游戏特性,而是专注于长时间运行的稳定性和兼容性

    • 更新频率低:它不会频繁更新,只有在修复重大 Bug 或安全漏洞时才会推送,适合 7x24 小时运行的服务器

    • 功能完整:它包含了数据中心显卡所需的所有管理工具(如 nvidia-smi 的完整功能)

对于服务器追求稳定,建议安装 -server 版本,如果要追求最新特性和性能,则接受Ubuntu建议安装 -open 版本。

如果接受默认 recommanded 则可以使用 ubuntu-drivers 工具的自动安装功能:

接受默认建议自动安装
ubuntu-drivers autoinstall

不过,我主要用于服务器上运行,追求稳定,并且 arch linux wiki: NVIDIA 提到 nvidia-open 主要用于Blackwell和更新硬件,其中GSP firmware已知会导致Turing GPU的电源管理子优化系统问题,所以我感觉我的 NVIDIA Tesla A2 GPU运算卡 使用的Ampere架构采用 -server 版本可能更稳健:

安装指定server版本
apt install nvidia-driver-590-server

备注

add-apt-repository ppa:graphics-drivers/ppa 命令可以为Ubuntu添加第三方维护的图形驱动仓库,提供了最新的NVIDIA beta驱动。在添加了第三方PPA仓库之后,同样使用 ubuntu-drivers devices 搜索和安装驱动,有可能对于桌面应用起到更大加速。

此外也可以采用 安装NVIDIA Linux驱动 中官方仓库安装

  • 安装完成后重启系统,并执行 nvidia-smi 确认GPU正确初始化

输出显示初始状态
Mon Mar 16 15:42:45 2026       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 590.48.01              Driver Version: 590.48.01      CUDA Version: 13.1     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA A2                      Off |   00000000:01:00.0 Off |                    0 |
|  0%   43C    P0             21W /   60W |       0MiB /  15356MiB |      2%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   1  NVIDIA A2                      Off |   00000000:02:00.0 Off |                    0 |
|  0%   45C    P0             20W /   60W |       0MiB /  15356MiB |      1%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

卸载590驱动

当我准备在台式机上准备同时使用 NVIDIA Tesla A2 GPU运算卡Nvidia Tesla P10 GPU运算卡 时候,系统提示当前安装的590版本驱动和P10不兼容,需要回退到580版本。所以执行

  • 清理nvidia和cuda相关软件包:

清理nvidia和cuda相关包
# 执行卸载
sudo apt purge "*nvidia*" "*cuda*"

# 清理孤立的依赖包和缓存
sudo apt autoremove --purge
sudo apt clean

# 手动检查并删除遗留的物理目录(很多编译残留或三方配置在这里)
sudo rm -rf /etc/nvidia
sudo rm -rf /usr/lib/nvidia

# 检查当前的 dms 状态
dkms status

# 如果显示dkms命令不存在,则表明nvidia不是通过dkms安装,则跳过这步
# 如果dkms状态输出中还看到类似 nvidia/590.xx... 的字样,必须手动将其移除(如果没有则跳过此步)
# 格式为:sudo dkms remove nvidia/版本号 --all
# 例如:
sudo dkms remove nvidia/590.x.x --all

# 刷新内核 initramfs 镜像(把旧的 NVIDIA 模块从系统启动引导中彻底抹去)
sudo update-initramfs -u

# 重启
sudo reboot

安装580驱动

  • 如果执行 sudo ubuntu-drivers devices 出现报错提示 ERROR:root:aplay command not found 则表明刚才清理时候删除了 alsa-utils 软件包,该软件包提供了 aplay 播放工具(NVIDIA高清音频驱动和系统音频工具链存在依赖级联,强力清理是autoremove掉alsa-utils),当使用 ubuntu-drivers devices 时会调用这个工具,所以可以通过补安装 alsa-utils 来恢复

安装指定nvidia-580 server版本
apt install nvidia-driver-580-server

参考