分布广泛和深入与tf.contrib.learn例如卡住k8s

我是分布式张量stream的新手。 我尝试在一个节点k8s集群上运行分布式的广泛和深度的例子,但工作任务都卡在INFO:tensorflow:Create CheckpointSaverHook.

在localhost和docker中testing都可以。

这是我的代码。 https://github.com/zhoudongyan/wide-and-deep

  • docker版本:17.03.1-ce
  • k8s版本:v1.6.3
  • tensorflow版本:1.1.0,python3
  • os:ubuntu 14.04 64bit

任何人都知道如何正确运行它? 非常感谢!

Interesting Posts