Kubernetes节点由于docker覆盖造成的高磁盘使用率

我正面临AWS上部署的kubernetes节点的问题。（具有3个节点和1个master的群集，每个大约25GB的m3.large实例运行）

（大约3天后）磁盘上剩下0KB，集群卡住了。

所有的存储（或多或less）都被/ var / lib / docker / overlay /使用。这个文件夹里面大约有500个以上的文件：

drwx------ 3 root root 4096 Jun 20 15:33 ed4f90bd7a64806f9917e995a02974ac69883a06933033ffd5049dd31c13427a drwx------ 3 root root 4096 Jun 20 15:28 ee9344fea422c38d71fdd2793ed517c5693b0c8a890964e6932befa1ebe5aa63 drwx------ 3 root root 4096 Jun 20 16:17 efed310a549243e730e9796e558b2ae282e07ea3ce0840a50c0917a435893d42 drwx------ 3 root root 4096 Jun 20 14:39 eff7f04f17c0f96cff496734fdc1903758af1dfdcd46011f6c3362c73c6086c2 drwx------ 3 root root 4096 Jun 20 15:29 f5bfb696f5a6cad888f7042d01bfe146c0621517c124d58d76e77683efa1034e drwx------ 3 root root 4096 Jun 20 15:26 f5fa9d5d2066c7fc1c8f80970669634886dcaccc9e73ada33c7c250845d2fe8c drwx------ 3 root root 4096 Jun 20 14:38 f8fd64fb1e0ab26708d5458dddd2d5a70018034237dfed3db48ada5666fcf77f drwx------ 3 root root 4096 Jun 20 14:46 faa143ebd7a4079eaa45ddbf17dcfc9163e3035983f2e334e32a60e89452fa94 drwx------ 3 root root 4096 Jun 20 14:48 fb93c0c64e0d4935bf67fc8f70df2b8a4cffe59e294ee8a876dfdf6b57486da5 drwx------ 3 root root 4096 Jun 20 14:46 fd0a420d5655fb7d022c397effdb95968ff7e722c58fcc7915f97e8df47cd080

集群在Kubernetes 1.6.4和Docker 1.12.6上运行。

似乎是kubernetes的垃圾收集器的问题。运行cAdvisor /validation给我下面的消息

  None of the devices support 'cfq' I/O scheduler. No disk stats can be reported. Disk "xvda" Scheduler type "none".

运行这些语句journalctl -u kubelet | grep -i garbage journalctl -u kubelet | grep -i garbage也给出错误信息： Jun 20 14:35:21 ip-172-21-4-239 kubelet[1551]: E0620 14:35:21.986898 1551 kubelet.go:1165] Image garbage collection failed: unable to find data for container /

任何想法如何让垃圾回收器再次工作？

Kubernetes节点由于docker覆盖造成的高磁盘使用率

如何将文件从Docker镜像写入EFS？

容器正在产生，但是当产生多个docker容器时，发出的命令失败

ec2上的Amazon的Docker的最新版本是否被破坏？

以AWS EC2上的ec2用户身份运行Docker容器

是否可以在EC2实例上执行AWS CLI命令，而不在AWS上放置AWS凭证？

使用Jenkins在EC2实例上执行CI / CD

AWS EC2上Docker的持久存储解决scheme

如何在ECS上托pipenodejs应用程序？

我怎样才能使用docker集装箱在EC2实例（Ubuntu 16.04）中调用我的API

从其他服务器连接到泊坞窗内的cassandra