nvidia-smi可执行文件未find

在nvidia-docker回购中,我已经经历了3个不同的问题,但实际上却搞不清楚是什么问题。

我是一个沉重的docker使用者,但我不太了解这些问题中使用的术语和解决scheme。

当我运行nvidia-smi作为sudo,一切都很好,我得到了标准输出。 我的nvidia-docker-plugin正在运行,当我运行nvidia-docker run --rm nvidia/cuda nvidia-smi run时,我得到了这些消息nvidia-docker run --rm nvidia/cuda nvidia-smi

nvidia-docker-plugin | 2017/11/04 09:14:18接收到音量“nvidia_driver_387.22”的挂载请求Blockquote nvidia-docker-plugin | 2017/11/04 09:14:18收到卸载请求卷'nvidia_driver_387.22'

我也尝试运行deepo存储库,无法得到它的工作,因为所有我的容器在启动时退出,并且nvidia-docker run --rm nvidia/cuda nvidia-smi输出错误:

container_linux.go:247:启动容器进程导致“exec:\”nvidia-smi \“:可执行文件在$ PATH中找不到”/ usr / bin / docker-current:来自守护程序的错误响应:oci运行时错误:container_linux.go :247:启动容器进程导致“exec:\”nvidia-smi \“:在$ PATH中找不到可执行文件”。

我究竟做错了什么?

我运行Fedora 26,如果有什么区别的话

在Ubuntu上,你应该安装nvidia-modprobe软件包。 我知道Fedora也存在。 出于某种原因,这种依赖不需要logging。

我刚刚解决了这个问题。

删除与nvidia-docker-plugin相关的音量解决了这个问题。

对于将来的读者,只要读出你的nvidia-docker-plugin上的日志消息,查找mount / unmount日志行,然后使用下面的命令删除卷

docker volume rm -f <volume_to_remove>其中volume_to_remove应该是像nvidia_driver_387.22 (这符合我的情况)

似乎问题是映射到nvidia-smi电话是在卷的创build和删除和重新附加卷修复