Tag:

Mesos查杀任务。 无法确定“cpu”子系统的cgroup

我正在通过Marathon(v0.9.0)在Mesos(v0.22.1)的Docker中运行一堆服务,有时Mesos会查杀任务。 通常情况下,它一次发生多个服务 与mesos-slave.ERROR log有关的这个问题的日志行: Failed to update resources for container 949b1491-2677-43c6-bfcf-bae6b40534fc of executor production-app-emails.15437359-a95e-11e5-a046-e24e30c7374f running task production-app-emails.15437359-a95e-11e5-a046-e24e30c7374f on status update for terminal task, destroying container: Failed to determine cgroup for the 'cpu' subsystem: Failed to read /proc/21292/cgroup: Failed to open file '/proc/21292/cgroup': No such file or directory

docker上的马拉松容器没有完成

我有Mesos群集由3个CentOS6.5机器组成。 ZooKeeper和Mesos-Master在其中一台机器上运行,Mesos-Slave在每台机器上运行。 而且,Marathon正在主节点上运行。 然后,我试图在Marathon上运行Docker容器,遵循Mesosphere的这个指令 。 job.json如下所示, { "container": { "type": "DOCKER", "docker": { "image": "libmesos/ubuntu" } }, "id": "ubuntu", "instances": 1, "cpus": 0.5, "mem": 512, "uris": [], "cmd": "date -u +%T" } 然后我运行下面的命令, curl -X POST -H "Accept: application/json" -H "Content-Type: application/json" <master-hostname>:8080/v2/apps -d@job.json 然后在Marathon Web UI上,即使经过很长时间,我也可以看到Docker容器处于“Deploying”状态。 而在Mesos-Masternetworking用户界面上,我可以看到这个Task长时间处于“STAGING”状态。 在沙箱窗格上,我可以看到标准输出,命令似乎完成了成功。 没问题。 stderr就是这样, I0416 19:19:49.254998 29178 exec.cpp:132] […]

如何找出Docker镜像的哪些图层是基础镜像的一部分

有没有什么办法来得到使用dockerregistryAPI的基础镜像(从FROM指令inheritance)的Docker镜像的哪一层? 我想分析我的Dockerfile添加的新图层。 要做到这一点,我需要筛选和隔离新的图层,将原始基础图像中的每一层都分开,并且我没有看到一个可信的方法来处理调用后得到的响应 myregistry / V2 / MYIMAGE /舱单/ mytag

马拉松 – 当返回码= 0时不要重新部署应用程序?

我们有一个在Docker容器中部署的spring引导应用程序,并使用mesosphere(marathon + mesos)进行pipe理。 春季启动应用程序旨在通过马拉松部署,一旦完成,它将退出代码= 0。 目前,每次启动应用程序终止,马拉松再次重新部署应用程序,我希望禁用。 是否有一个设置,我可以在应用程序的马拉松jsonconfiguration文件中设置,这将阻止马拉松重新部署应用程序,如果它不退出非零代码?

Docker应用程序部署在Marathon上挂起,在Mesos上失败

我尝试Dockerizing Zookeeper / Marathon / Mesos( 从 Dockerized Mesos集群部署Docker容器)(可能是愚蠢的)任务。 到目前为止,我在两个物理分离的节点上有一个工作的Mesos集群:一个节点同时运行一个Mesos 主站和一个从站 (容器Dockerfiles链接),第二个节点只运行一个从站。 他们似乎运作良好; 我能够通过Marathon(也是自己的容器,在主节点和从属节点上运行)提交非常简单的作业,并且成功完成。 但是,当我尝试通过Marathon API提交Docker容器时 ,它似乎挂起。 Marathon界面挂在“部署”上,即使放置15分钟后,也不会改变,停止,重新提交,然后再等待15分钟。 同时,任务仍然被提交给Mesos奴隶; Mesos UI正在向左和向右报告FAILED任务。 编辑1 每个执行者所产生的Sandbox日志也是完全空的。 编辑2 发现一些有趣的东西埋在奴隶日志中: 兴趣点: 所有已启用的容器(mesos)都不能为提供的TaskInfo / ExecutorInfo消息创build一个容器。 看起来集装箱船不能运行,而且从我所看到的情况来看,它甚至没有把docker作为集装箱船。 我在这里configuration了部署Docker作业。 如果Mesos从站本身就是Docker容器,这是否会改变? 我有点超出了我的元素,无法find任何引用沿这些线。 有什么想法发生了什么?

Chronos不运行工作

我已经设置了Mesos Cluster,包括Marathon和Chronos,每个服务都使用Docker镜像。 我使用的Docker镜像如下; ZooKeeper: jplock / zookeeper:3.4.5 Mesos Master: redjack / mesos-master:0.21.0 Mesos Slave: redjack / mesos-slave:0.21.0 马拉松:中间层/马拉松:v0.8.2-RC3 Chronos : tomaskral / chronos:2.3.0-mesos0.21.0 ZooKeeper运行在端口2181上,Mesos Master运行在5050上,Mesos Slave运行在5051上,马拉松运行在8088上,Chronos运行在8080上。 我想要做的是 在Marathon&Chronos上运行Docker容器。 Marathon成功运行Docker容器作为其应用程序。 但Chronos不运行任何工作。 即使Job不在Docker中。 Chronos工作的configuration我试图启动是; { "schedule": "R/2015-05-28T10:16:30Z/PT2M", "name": "simplejob", "cpus": "0.5", "mem": "512", "command": "while sleep 10; do date -u %T; done" } 乔布斯在Chronos上注册,但从未启动。 我运行Chronos容器的命令如下: docker run […]

如何使用卷 – 从马拉松

我正在与mesos +马拉松+docker工作了一段时间,但我在某个时候卡住了。 目前我试图处理持久性容器,我尝试使用“volume-from”参数,但是我无法工作,因为我不知道如何找出数据框的名称它作为JSON的一个关键。 我用这里的例子试了一下 { "id": "privileged-job", "container": { "docker": { "image": "mesosphere/inky" "privileged": true, "parameters": [ { "key": "hostname", "value": "a.corp.org" }, { "key": "volumes-from", "value": "another-container" }, { "key": "lxc-conf", "value": "…" } ] }, "type": "DOCKER", "volumes": [] }, "args": ["hello"], "cpus": 0.2, "mem": 32.0, "instances": 1 } 我真的很感激任何forms的帮助:-)

Docker Swarm和Kubernetes / Mesophere有何区别?

据我所知,Kubernetes / Mesosphere是一个集群pipe理器,Docker Swarm是一个编排工具。 我想了解他们是如何不同? Docker Swarm类似于Docker世界中的POSIX API,而Kubernetes / Mesosphere是不同的实现? 或者他们是不同的层次?

为什么容器无法在DC / OS中获取URI?

我已经在Digital Ocean(DC / OS 1.9)上创build了一个使用terraform的集群,遵循这些指示 一切似乎已经正确安装,从私人docker回购,我需要添加一个压缩的.docker文件到我的/core/home/和部署期间通过将其包含在我的JSON中获取它。 "fetch":[ { "uri":"file:///home/core/docker.tar.gz" } ] 根据这些说明: https : //docs.mesosphere.com/1.9/deploying-services/momee/docker-creds-agent/ 而我仍然遇到错误: Failed to launch container: Failed to fetch all URIs for container 'abc123-xxxxx' with exit status: 256 在查看其中一个代理的日志时: Starting container '123-abc-xxx' for task 'my-docker-image-service.321-dfg-xxx' (and executor 'my-docker-image-service.397d20cb-1 Begin fetcher log (stderr in sandbox) for container 123-abc-xxx from running command: /opt/mesosphere/packages/mesos–aaedd03eee0d57f5c0d49c […]

Mesos 1.2.1&1.3.1从站 – docker工作正常退出,但报告为失败

我的mesos版本最近从0.28升级到1.2.1。 乔布斯正在计划使用Chronos。 我的docker工作正在被调用,但仍然得到TASK_FAILED错误事件它完成与退出状态ZERO。 这是总是可重现的。 我尝试了多个mesos版本,但仍然没有运气。 想知道我是否缺less任何东西。 操作系统细节: – Kernel – 3.8.13-98.7.1.el7uek OS – OL 7.3 Sanpshot – 7-2017.6.4 因为它不是最新的Kernal,所以我在Chronos Job环境variables中添加了以下内容,因为我无法安装最新的docker版本。 { "name":"DOCKER_API_VERSION", "value":"1.22" } 用标志启动'mesos-docker-executor' '–container="mesos-81cb9c2a-d18b-4127-872b-2a5676dfb314-S0.97dc2c67-5d69-4a8c-b4e1-ba15807697cf" –docker="docker" –docker_socket="/var/run/docker.sock" –help="false" –initialize_driver_logging="true" –launcher_dir="/usr/libexec/mesos" –logbufsecs="0" –logging_level="INFO" –mapped_directory="/mnt/mesos/sandbox" –quiet="false" –sandbox_directory="/mesos-data/slave-1/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/docker/links/97dc2c67-5d69-4a8c-b4e1-ba15807697cf" –stop_timeout="0ns"' Mesos从站日志: – I0906 14:05:00.958442 9 slave.cpp:1625] Got assigned task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000 I0906 14:05:00.958544 9 slave.cpp:6386] Checkpointing […]