安装NVIDIA Linux驱动(Ubuntu)
安装590驱动
我之前 安装NVIDIA Linux驱动 实践中采用了官方仓库方式安装。Ubuntu提供了一个简单工具来查看最适合自己显卡的驱动器版本:
ubuntu-drivers devices
输出显示中标记为 recommanded 就是最推荐的驱动版本:
590...
== /sys/devices/pci0000:00/0000:00:03.0/0000:08:00.0 ==
modalias : pci:v000010DEd000025B6sv000010DEsd0000157Ebc03sc02i00
vendor : NVIDIA Corporation
model : GA107GL [A2 / A16]
driver : nvidia-driver-580 - distro non-free
driver : nvidia-driver-570-server - distro non-free
driver : nvidia-driver-590-open - distro non-free recommended
driver : nvidia-driver-590-server - distro non-free
driver : nvidia-driver-535-server-open - distro non-free
driver : nvidia-driver-590 - distro non-free
driver : nvidia-driver-570-server-open - distro non-free
driver : nvidia-driver-535-open - distro non-free
driver : nvidia-driver-590-server-open - distro non-free
driver : nvidia-driver-580-server - distro non-free
driver : nvidia-driver-570-open - distro non-free
driver : nvidia-driver-580-server-open - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-580-open - distro non-free
driver : nvidia-driver-535 - distro non-free
driver : nvidia-driver-535-server - distro non-free
driver : nvidia-driver-470 - distro non-free
driver : nvidia-driver-570 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
需要注意的是 590 有3个版本 open , server 和 server-open :
nvidia-driver-590-open是NVIDIA 近年来主推的新架构内核部分开源:驱动分为两部分,一部分是闭源的用户态库(CUDA、OpenGL),另一部分是开源的内核模块
支持对象:仅支持 Turing (图灵) 架构及以后的架构( NVIDIA Tesla A2 GPU运算卡 是 Ampere 架构完全支持)
优势:与 Linux 内核(尤其是 Ubuntu 24.04 的新内核)集成更好,符合现代 Linux 发行版的安全标准,支持一些仅限开源模块的高级功能(如 GSP 固件管理)
nvidia-driver-590-server是服务器长期支持版稳定性优先:Server 版驱动不追求最新的游戏特性,而是专注于长时间运行的稳定性和兼容性
更新频率低:它不会频繁更新,只有在修复重大 Bug 或安全漏洞时才会推送,适合 7x24 小时运行的服务器
功能完整:它包含了数据中心显卡所需的所有管理工具(如 nvidia-smi 的完整功能)
对于服务器追求稳定,建议安装 -server 版本,如果要追求最新特性和性能,则接受Ubuntu建议安装 -open 版本。
如果接受默认 recommanded 则可以使用 ubuntu-drivers 工具的自动安装功能:
ubuntu-drivers autoinstall
不过,我主要用于服务器上运行,追求稳定,并且 arch linux wiki: NVIDIA 提到 nvidia-open 主要用于Blackwell和更新硬件,其中GSP firmware已知会导致Turing GPU的电源管理子优化系统问题,所以我感觉我的 NVIDIA Tesla A2 GPU运算卡 使用的Ampere架构采用 -server 版本可能更稳健:
apt install nvidia-driver-590-server
备注
add-apt-repository ppa:graphics-drivers/ppa 命令可以为Ubuntu添加第三方维护的图形驱动仓库,提供了最新的NVIDIA beta驱动。在添加了第三方PPA仓库之后,同样使用 ubuntu-drivers devices 搜索和安装驱动,有可能对于桌面应用起到更大加速。
此外也可以采用 安装NVIDIA Linux驱动 中官方仓库安装
安装完成后重启系统,并执行
nvidia-smi确认GPU正确初始化
Mon Mar 16 15:42:45 2026
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 590.48.01 Driver Version: 590.48.01 CUDA Version: 13.1 |
+-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA A2 Off | 00000000:01:00.0 Off | 0 |
| 0% 43C P0 21W / 60W | 0MiB / 15356MiB | 2% Default |
| | | N/A |
+-----------------------------------------+------------------------+----------------------+
| 1 NVIDIA A2 Off | 00000000:02:00.0 Off | 0 |
| 0% 45C P0 20W / 60W | 0MiB / 15356MiB | 1% Default |
| | | N/A |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+
卸载590驱动
当我准备在台式机上准备同时使用 NVIDIA Tesla A2 GPU运算卡 和 Nvidia Tesla P10 GPU运算卡 时候,系统提示当前安装的590版本驱动和P10不兼容,需要回退到580版本。所以执行
清理nvidia和cuda相关软件包:
# 执行卸载
sudo apt purge "*nvidia*" "*cuda*"
# 清理孤立的依赖包和缓存
sudo apt autoremove --purge
sudo apt clean
# 手动检查并删除遗留的物理目录(很多编译残留或三方配置在这里)
sudo rm -rf /etc/nvidia
sudo rm -rf /usr/lib/nvidia
# 检查当前的 dms 状态
dkms status
# 如果显示dkms命令不存在,则表明nvidia不是通过dkms安装,则跳过这步
# 如果dkms状态输出中还看到类似 nvidia/590.xx... 的字样,必须手动将其移除(如果没有则跳过此步)
# 格式为:sudo dkms remove nvidia/版本号 --all
# 例如:
sudo dkms remove nvidia/590.x.x --all
# 刷新内核 initramfs 镜像(把旧的 NVIDIA 模块从系统启动引导中彻底抹去)
sudo update-initramfs -u
# 重启
sudo reboot
安装580驱动
如果执行
sudo ubuntu-drivers devices出现报错提示ERROR:root:aplay command not found则表明刚才清理时候删除了alsa-utils软件包,该软件包提供了aplay播放工具(NVIDIA高清音频驱动和系统音频工具链存在依赖级联,强力清理是autoremove掉alsa-utils),当使用ubuntu-drivers devices时会调用这个工具,所以可以通过补安装alsa-utils来恢复
apt install nvidia-driver-580-server