分布广泛和深入与tf.contrib.learn例如卡住k8s
我是分布式张量stream的新手。 我尝试在一个节点k8s集群上运行分布式的广泛和深度的例子,但工作任务都卡在INFO:tensorflow:Create CheckpointSaverHook.
在localhost和docker中testing都可以。
这是我的代码。 https://github.com/zhoudongyan/wide-and-deep
- docker版本:17.03.1-ce
- k8s版本:v1.6.3
- tensorflow版本:1.1.0,python3
- os:ubuntu 14.04 64bit
任何人都知道如何正确运行它? 非常感谢!