ubuntu 22.04 server安装Nvidia驱动

ubuntu 22.04 server安装Nvidia驱动

1
2
3
4
5
sudo apt install -y apt-rdepends
# sudo apt install -y net-toolsb
# sudo apt install -y openssh-server
sudo apt download $(apt-rdepends apt-rdepends | grep -v "^ " | sed 's/debconf-2.0/debconf/g' | grep -v "perlapi-")
sudo apt download $(apt-rdepends net-tools | grep -v "^ " | sed 's/debconf-2.0/debconf/g')

方法一

Nvidia驱动安装准备操作(同步机不需要操作,服务器操作)

确定系统识别到了显卡

1
lspci | grep -i nvidia

列出已安装的NVIDIA软件包

1
dpkg -l | grep -i nvidia

确保卸载干净残留的nvidia驱动

1
sudo apt remove --purge '^nvidia-.*'

安装必要依赖(同步机操作)

1
2
3
4
5
# sudo apt install -y net-tools
sudo apt download $(apt-rdepends net-tools | grep -v "^ " | sed 's/debconf-2.0/debconf/g')
# sudo apt install -y gcc make
sudo apt download $(apt-rdepends gcc make | grep -v "^ " | sed 's/debconf-2.0/debconf/g')
sudo dpkg -i *.deb

禁用nouveau显卡驱动(服务器操作)

1
nouveau是第三方开发的开源显卡驱动,安装NVIDIA官方的显卡驱动之前,需要先禁用它。

编辑vim /etc/modprobe.d/blacklist.conf文件,末尾添加如下代码

1
2
blacklist nouveau
options nouveau modeset=0

更新内核

1
sudo update-initramfs -u

更新后reboot重启 重启后通过以下命令验证,没有任何输出结果则代表禁用成功

1
lsmod | grep nouveau

安装NVIDIA显卡驱动(服务器操作)

apt命令安装 执行如下命令,查看适合的驱动

1
ubuntu-drivers devices

安装驱动

1
2
3
# apt-get install nvidia-driver-535
sudo apt download $(apt-rdepends nvidia-driver-535 | grep -v "^ " | grep -v -e "xorg-video-abi" -e "libc-dev" -e "kldutils" -e "perlapi-5.34" | sed 's/debconf-2.0/debconf/g')
sudo dpkg -i *.deb

测试驱动是否正常工作

1
nvidia-smi

方法二

准备工作

1
2
为了避免踩坑,建议按照流程完成准备工作!
这些准备工作并不会影响你的计算机,不做的话可能会导致装驱动后黑屏!
关闭安全模式
1
重启计算机,在开机前狂按’ESC’进入bios设置,找到安全设置,并关闭它。

注:不同品牌电脑进入bios方式和安全设置的位置都不相同

切换独显模式
1
在bios设置中找到显卡设置,系统默认的为集显模式,将其修改为独显模式。
更新软件列表和安装必要软件、依赖
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
sudo apt-get update   #更新软件列表

# sudo apt-get install -y g++ gcc make
sudo apt download $(apt-rdepends g++ gcc make | grep -v "^ " | sed 's/debconf-2.0/debconf/g')
 
sudo apt download $(apt-rdepends python3-pip | grep -v "^ " | sed 's/debconf-2.0/debconf/g')
sudo apt download $(apt-rdepends build-essential cmake git | \
                      grep -v "^ " | \
                      sed 's/debconf-2.0/debconf/g' | \
                      sed -e 's/libc-dev/libc6-dev/g' \
                          -e 's/libc6-dev-bin/libc6-dev/g' \
                          -e 's/linux-libc6-dev/linux-libc-dev/g' | \
                      grep -vE "^(default-logind|logind)$")
配置wifi

输入如下指令来安装network-manager

1
2
# sudo apt install network-manager
sudo apt download $(apt-rdepends network-manager | grep -v "^ " | sed 's/debconf-2.0/debconf/g' | grep -vE "^(default-logind|logind)$")

启动NetworkManager服务

1
2
sudo systemctl start NetworkManager
sudo systemctl enable NetworkManager

查找可用的WiFi

1
nmcli dev wifi list

选择一个WiFi并连接,将<SSID>改为你的wifi名,<password>改为密码

1
nmcli dev wifi connect <SSID> password <password>

确认网络是否连接

1
nmcli connection show

设置为自动连接,这样每次开机后即自动连接该wifi

1
nmcli connection modify <SSID> connection.autoconnect yes

检查自动连接是否启用,如果connection.autoconnect为yes则已启用

1
nmcli connection show <SSID>
禁用nouveau (nouveau是通用的驱动程序)
1
sudo vim /etc/modprobe.d/blacklist.conf

文件末尾添加下面两行内容

1
2
blacklist nouveau
options nouveau modeset=0

文件修改后在终端执行:

1
2
sudo update-initramfs -u
sudo reboot #重启电脑

电脑重启后执行:

1
lsmod | grep nouveau  #输出内容为空,则表示成功禁用
安装lightdm

lightdm和gdm3一样都是图形界面管理插件,但是lightdm兼容性更好

1
2
# sudo apt-get install lightdm
sudo apt download $(apt-rdepends lightdm | grep -v "^ " | sed 's/debconf-2.0/debconf/g' | grep -v "^awk$")

用上下按键选中lightdm

安装驱动

1
网上安装方式杂七杂八很多,推荐把Ubuntu升级到22版本后使用系统推荐安装方式。
安装 nvidia-cuda-toolkit 工具
1
2
# sudo apt-get install nvidia-cuda-toolkit
sudo apt download $(apt-rdepends nvidia-cuda-toolkit | grep -v "^ " | grep -v -E "^(debconf-2.0|libcuda|libnvidia|opencl-dev|clang-[0-9]|g\+\+-[0-9]|gcc-[0-9])" | sed 's/debconf-2.0/debconf/g')
检查系统推荐显卡驱动,记录下recommend选项
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
$ sudo ubuntu-drivers devices

== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd000028E0sv0000103Csd00008BABbc03sc00i00
vendor   : NVIDIA Corporation
driver   : nvidia-driver-535-open - distro non-free
driver   : nvidia-driver-535-server-open - distro non-free
driver   : nvidia-driver-535 - distro non-free recommended #记下推荐版本
driver   : nvidia-driver-525-server - distro non-free
driver   : nvidia-driver-535-server - distro non-free
driver   : nvidia-driver-525 - distro non-free
driver   : nvidia-driver-525-open - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin
安装NVIDIA显卡驱动
方法一:安装NVIDIA显卡驱动(服务器操作)

apt命令安装 执行如下命令,查看适合的驱动

1
ubuntu-drivers devices

安装驱动

1
2
3
# apt-get install nvidia-driver-535
sudo apt download $(apt-rdepends nvidia-driver-535 | grep -v "^ " | grep -v -e "xorg-video-abi" -e "libc-dev" -e "kldutils" -e "perlapi-5.34" | sed 's/debconf-2.0/debconf/g')
sudo dpkg -i *.deb

测试驱动是否正常工作

1
nvidia-smi
方法二
添加驱动源
1
2
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
在Ubuntu系统中找到 软件和更新 选择 驱动
1
2
按照图示找到附加驱动,选择推荐版本
注意:不要选择第一项,可能会导致黑屏

安装完成后sudo reboot重启计算机

方法三
1
2
# 根据前边的教程获取推荐版本,然后下载对应的版本进行如下方式安装
./NVIDIA-Linux-x86_64-580.105.08.run --no-opengl-files

重启后测试安装

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
$ nvidia-smi

Wed Jul 19 11:08:47 2023       
+---------------------------------------------------------------------------------------+
    | NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
    |-----------------------------------------+----------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
    |                                         |                      |               MIG M. |
    |=========================================+======================+======================|
    |   0  NVIDIA GeForce RTX 4060 ...    Off | 00000000:01:00.0  On |                  N/A |
    | N/A   40C    P8               2W /  80W |    571MiB /  8188MiB |      0%      Default |
    |                                         |                      |                  N/A |
    +-----------------------------------------+----------------------+----------------------+
    
    +---------------------------------------------------------------------------------------+
    | Processes:                                                                            |
    |  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
    |        ID   ID                                                             Usage      |
    |=======================================================================================|
    |    0   N/A  N/A      1489      G   /usr/lib/xorg/Xorg                          202MiB |
    |    0   N/A  N/A      2539      G   /usr/bin/gnome-shell                         57MiB |
    |    0   N/A  N/A      3848      G   ...irefox/2908/usr/lib/firefox/firefox      205MiB |
    |    0   N/A  N/A     20451      G   ...dererForSitePerProcess --no-sandbox       94MiB |
    +---------------------------------------------------------------------------------------+

显示如上则表示安装完成。

出错急救

1
如果驱动安装后不幸导致黑屏,尝试以下操作删除驱动,恢复安装前状态。
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
#在黑屏界面 ctrl+alt+f1 进入tty命令行,正确输入用户名和密码,再进行接下来的操作
#在tty中先修改字符集
export LANGUAGE="UTF-8"
#执行删除操作
sudo apt-get --purge remove nvidia*
sudo apt autoremove
#重启
reboot

#如果上述操作不超过,尝试以下命令删除
sudo apt-get remove --purge nvidia*

删除驱动后,进入系统界面,从第一步开始重新安装即可。

把文件制作成iso,上传并将挂载到服务器

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
# windows使用软碟通制作iso文件

# 从windows将iso文件上传到服务器
rsync -rP nvidia-driver.iso root@192.168.234.38:~/

# 服务器操作
mount -t auto nvidia-driver.iso /mnt/
cd /mnt/
dpkg -i /*.deb
./NVIDIA-Linux-x86_64-580.105.08.run
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计