Tag: 深度学习

我如何重现“改进的GAN”代码? theano / cudnn / docker的问题

我一直在试图重现这里find的代码,关于OpenAI的“改进的GAN”,但是我在设置环境(Docker容器)方面遇到了很多麻烦。 我只是不能使Theano这个代码正常工作。 我创build了一个Docker容器来testing它,但是当使用使用conda安装的Theano的稳定版本时引发了分段错误。 有些postbuild议使用Theano的开发版本,但是当我更新时,Theano找不到Cudnn了 (gpuarray/dnn.py", line 98, in _dnn_lib raise RuntimeError('Could not load cudnn library') RuntimeError: Could not load cudnn library) 如果有人有一些与Theano /烤宽面条/docker的背景可以帮助我,我会很感激。 如果要求我可以粘贴我的Dockerfile ,或任何可以帮助。

docker集装箱中是否提供NCCL2?

我将要构build一个infiniband GPU集群以进行深度学习。 由于有几个主机,我想通过使用nvidia-docker(Dockerfile)来简化部署。 许多深度学习框架都有自己的官方容器(Dockerfile),所以我认为很多人都认为它是很自然的。 我知道如何将预先下载的NCCL2库复制到docker容器中,但我从来没有尝试过/testing在两个在不同主机上设置的docker容器之间是否有GPUDirect RDMA传输。 而且我也找不到任何有人试图用NCCL2实现这种Dockerfile进行分布式深度学习的资源。 有没有人尝试使用NCCL2来分发深层次的Docker容器?

如何以非root用户身份运行官方Tensorflow Docker镜像?

我目前使用Nvidia-Docker运行官方的Tensorflow Docker Container(GPU): https://hub.docker.com/r/tensorflow/tensorflow/ https://gcr.io/tensorflow/tensorflow/ 但是,我找不到为容器设置默认用户的方法。 此容器的默认用户是“ root ”,这在安全性方面是危险的,并且因为它提供了对共享文件夹的根访问权限。 比方说,我的主机与用户“ CNNareCute ”运行,有什么办法用同一个用户启动我的容器?

Docker错误从守护进程获取事件:EOF

错误报告信息 描述 大家好,遵循google codelabs, Codelabs CodeGo.net,我收到错误ERRO[4334] error getting events from daemon: EOF后Creating bottleneck at /tf_files/bottlenecks/roses/13231224664_4af5293a37.jpg.txt 更新:我reran它,这显示ERRO[53469] error getting events from daemon: EOF 重现问题的步骤: 1.“`python tensorflow / examples / image_retraining / retrain.py \ –bottleneck_dir = / tf_files / bottlenecks \ –how_many_training_steps 500 \ –model_dir = / tf_files / inception \ –output_graph = / tf_files / retrained_graph.pb […]

下载BAIR训练的咖啡模型使用脚本

我正尝试使用以下脚本通过命令行下载AlexNet的Caffe实现(在此处find: https : //github.com/BVLC/caffe/tree/master/models/bvlc_alexnet ): python /scripts/download_model_binary.py /models/bvlc_reference_caffenet/ 但我得到的错误: download_model_binary.py: error: argument dirname: Must be valid Caffe model directory with a correct readme.md 我无法手动下载文件或使用wget,因为一些权限问题/我在docker集装箱工作。 我怎样才能使用脚本下载?

H2O深水与docker集装箱模板 – >streamUI不可访问

我按照文档( https://github.com/h2oai/deepwater/blob/master/README.md )中的说明在我的Mac上启动了Deep Water Docker容器(CPU模式): docker run -it –rm -p 54321:54321 -p 8080:8080 -v $ PWD:/ host opsh2oai / h2o-deepwater-cpu 它启动正确,没有错误,但我不能访问H2O的UI在http://172.17.0.2:54321 … 日志中还有一个提示:如果连接有问题,请尝试从本地计算机进行SSH隧道操作1.打开terminal并运行“ssh -L 55555:localhost:54321 root@172.17.0.2”2.将浏览器指向HTTP://本地主机:55555 但是这也不起作用… 我使用Docker CE版本17.06.0-ce-mac19。 任何想法做什么? 这里是起始H2O的完整日志:

如何使用TensorFlow设置Udacity Deep Learning类的学习环境(Windows)

我相信很多有兴趣学习DL的人都听过这个课程: https://www.udacity.com/course/deep-learning–ud730 我现在正在学习这门课程,希望分享如何从头开始在Windows上设置学习环境的逐步指导。 设置环境的第一个答案是关于build立学习环境。 你只运行一次。 第二个名为AFTER LOCAL MACHINE REBOOT的答案是关于如何在重新启动计算机后启动环境。 查看第三个名为“ 如何工作”的答案,以了解所有这些东西是如何工作的(或者你可以盲目地遵循第一个答案并在以后检查出来)。

Docker – 如何将新的python依赖关系添加到现有的docker镜像?

我是docker的新手。 我在使用我的Windows 10操作系统中的tensorflow docker时遇到了困难。 当我跟随Udacity深入的学习过程时,我已经按照说明下载了tensorflow泊坞窗,并尝试启动第一个任务。 但是由于docker镜像缺lessscikit-learn软件包,所以未能启动。 所以基本上我做什么来克服这个问题是我第一次运行我的docker形象: docker run -it -p 8888:8888 b.gcr.io/tensorflow/tensorflow /bin/bash 然后我运行: pip install -U scikit-learn 然后我运行(可能不是100%正确,但类似): ./run_jupyter.sh 启动iPython笔记本进行我的任务。 我的问题很简单: 我该如何保存这个Docker镜像上发生的这个变化,所以我不必每次重新启动笔记本就重复这个步骤? 我可以通过修改dockerconfiguration文件来做到这一点吗?