Tag: 张量

docker的CP不工作

我正在学习本教程 ,当我到达我所调用的部分时: cp /tf_files/stripped_retrained_graph.pb bazel-bin/tensorflow/examples/android/assets/stripped_output_graph.pb 和 cp /tf_files/retrained_labels.txt bin/tensorflow/examples/android/assets/imagenet_comp_graph_label_strings.txt 他们都说“没有这样的文件或目录”。 正如你可以在这个图像中看到的,我可以cd到tf_files文件夹,看到文件在那里。 我也可以cd /tensorflow/tensorflow/examples/android/assets并调用ls ,显示那里只有一个BUILD文件。 在cp命令中应该已经有一个stripped_output_graph.pb文件在目标被取代? 还是只是在那里创build一个新的文件? 有没有做cp [source] [current directory]某种方式,而不是指定目的地为path? 我已经尝试删除文件path的一部分,希望它只是使用源文件名,但不起作用。

在Python中使用Docker进行图像训练(新手)

到目前为止,我所有的步骤都工作得很好。 我目前在一台Windows机器上。 我在使用该命令后在根目录中: docker run -it gcr.io /tensorflow/tensorflow:latest-devel 然后是cd / tensorflow,我现在在目录中,是时候训练的图像,所以我jused: / tensorflow#python tensorflow / examples / image_retraining / retrain.py \ –bottleneck_dir = / tf_files / bottlenets \ –how_many_training_steps 500 \ –model_dir = / tf_files / retrained_graph.pb \ –output_labels = / tf_files / retrained_labels.txt \ –image_dir / tf_files / 我得到这个错误:文件“tensorflow / examples / image_retraining / […]

分布广泛和深入与tf.contrib.learn例如卡住k8s

我是分布式张量stream的新手。 我尝试在一个节点k8s集群上运行分布式的广泛和深度的例子,但工作任务都卡在INFO:tensorflow:Create CheckpointSaverHook. 在localhost和docker中testing都可以。 这是我的代码。 https://github.com/zhoudongyan/wide-and-deep docker版本:17.03.1-ce k8s版本:v1.6.3 tensorflow版本:1.1.0,python3 os:ubuntu 14.04 64bit 任何人都知道如何正确运行它? 非常感谢!

在Docker容器上加载TensorFlow权重

我有一个运行TensorFlow Graph的Python脚本,我想在Docker容器中运行这个脚本。 我使用“load”函数(在TensorFlow中)从文件加载权重。 基本上我有这些文件: InceptionCnnModel_Intent350.data 00000-的-00001 InceptionCnnModel_Intent350.index InceptionCnnModel_Intent350.meta 我运行以下命令: model.load('lib/InceptionCnnModel_Intent350') 如果我在我的本地机器上运行脚本,它的工作(我有预期的结果)。 如果我在docker文件中运行脚本,它不起作用。 它不工作,因为它不会在model.load之后不打印任何东西,而且这也是(Docker容器的)控制台中的输出: 2017-06-27 13:13:44.265722: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations. 2017-06-27 13:13:44.265769: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are […]

Tensorflow应用程序在docker容器中冻结

我有一个tensorflow应用程序,在ubuntu 16.04上运行良好,但是当我试图在tensorflow / tensorflow泊坞窗图像w / nvidia-docker中运行它时,它到了这一点,然后冻结: 2017-07-12 22:06:10.917255: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations. 2017-07-12 22:06:10.917289: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed […]

仅当使用docker时,Tensorflow错误

我有我的笔记本电脑使用TensorFlow工作正常的CNN代码。 但是,当我使用"gcr.io/tensorflow/tensorflow"并在容器中安装所需的包时,出现以下错误: InvalidArgumentError(请参阅上面的回溯):除1之外的所有维度必须匹配。 input1具有形状[100 1],并且与形状[135 2560]的input0不匹配。 [[Node:gradients / net / concat_grad / ConcatOffset = ConcatOffset [N = 2,_device =“/ job:localhost / replica:0 / task:0 / cpu:0”](gradients / net / concat_grad / mod,gradients / net / concat_grad / ShapeN,gradients / net / concat_grad / ShapeN:1)]] 如果没有docker,没有形状不匹配的问题。 我在某个地方读到这可能是有意义的记忆问题。 但是,即使我给我的充分的内存,docker和减less批量大小,我仍然得到错误。 有谁知道是什么问题?

为什么Jupyter笔记本在docker张量图像上的atp-get更新之后没有启动?

我使用tensorflow图像: docker run -it -p 8888:8888 tensorflow/tensorflow Jupyter笔记本自动启动: [I 13:00:45.022 NotebookApp] The Jupyter Notebook is running at: … 我使用下一个命令附加到docker实例: docker run -i -t tensorflow/tensorflow /bin/bash 在此实例上运行apt-get update ,Jupyter Notebook不再启动。 我该如何解决它,为什么会发生?

Google Cloud:Kubernetes无法findtensorflow_model_server

我正在尝试使用TensorFlow Serving和Kubernetes服务初始模型中的教程部署Inception-v3模型 一切都很好,直到我运行命令: kubectl create -f tensorflow_serving/example/inception_k8s.yaml terminal输出build议成功创build服务“开始服务”和部署“开始部署”。 但是,当我跑时: kubectl get pods 我收到这个输出: NAME READY STATUS RESTARTS AGE inception-deployment-2217120516-ntmfl 0/1 CrashLoopBackOff 6 8m inception-deployment-2217120516-s8xlx 0/1 CrashLoopBackOff 6 8m inception-deployment-2217120516-tnzbl 0/1 CrashLoopBackOff 6 8m 通过获取第一个吊舱的日志,我得到了关于错误的信息。 运行: kubectl logs inception-deployment-2217120516-ntmfl 返回这个: /bin/sh: 1: serving/bazel-bin/tensorflow_serving/model_servers/tensorflow_model_server: not found 我能够在本地运行服务器,但是在tensorflow服务启动-k8s.yaml文件中使用的映像没有模型服务器。 这怎么解决? 我一直在试图解决这个问题

如何通过docker容器正确安装TFServer

我曾尝试多次在docker容器中安装TFServing。 但是,我仍然不能没有任何错误地build立它。 我遵循官方网站上的安装步骤 。 但是我在编译时仍然遇到编译错误。 我怀疑,如果在我build立的dockerfile中有一些缺陷。 我附上错误的截图。

Tensorflow Inception V3培训错误

我试图通过在Docker上重新训练Inception V3来创build肿瘤图像分类器。 当我运行Python脚本时,我的class级子文件夹中的图像未被检测到。 所有的图像都是PNG格式。 这是代码和错误: root@c47d0d562199:/classifier# python retrain.py bottlenecks_dir=bottlenecks –how_many_steps=4000 –model_dir=inception –summaries_dir=training_summaries/long –output_graph=retrained_graph.pb –output_labels=retrained_labels.txt –image_dir=Images 2017-11-16 21:26:20.099812: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations. 2017-11-16 21:26:20.099898: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but […]