docker上でnvidia-smiするとFailed to initialize NVMLが出る

ホストPCでnvidia-smiが正常動作する場合

以下を実行する。

sudo sed -i 's/^#no-cgroups = false/no-cgroups = false/;' /etc/nvidia-container-runtime/config.toml
sudo systemctl restart docker

参考: Nvida Container Toolkit: Failed to initialize NVML: Unknown Error - #3 by SimonBirrell - Linux - NVIDIA Developer Forums

ホストPCでもnvidia-smiでFailed to initialize NVMLが出る場合

以下を実行する。

sudo systemctl stop gdm
sudo systemctl isolate multi-user.target
sudo systemctl stop systemd-logind
sudo killall gdm-x-session

sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia

sudo systemctl restart docker