docker占用服务器cpu达99%

疑问

docker 为什么在运行一段时间后, cpu突然就会被占用接近100%. (由下面监控发现, 并不是一点点向上增加的) ?

使用docker stop [容器ID] 重启等命令会报#1中的错误信息. (守护进程什么时候被关闭? 是什么原因关闭) ?


env

  • Ubuntu 16.04.2
  • Docker version 17.12.0-ce, build c97c6d6
  • docker-compose version 1.18.0, build 8dd22a9

记录

通过top查看docker几乎占完CPU. docker-compose stop 出现下面错误, 无法停止. (docker 共运行7个, 于3周前开始运行, 但是2018-02-25 至 2018-02-27CPU使用率达到99%, 原因不详.)

service docker restart 重启docker服务CPU恢复正常(CPU占用不到10%)

#1 查的错误出现的原因可能是由于docker的守护进程被停止了.

ERROR: for dockerlnmp_mysql_1  cannot stop container: a0eabe6b996eebd82c79f6b810958e52a61f9e61ade8f834518e2a62b2074abc: Cannot kill container a0eabe6b996eebd82c79f6b810958e52a61f9e61ade8f834518e2a62b2074abc: connection error: desc = "transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused": unknown

ERROR: for phpmyadmin  cannot stop container: 46349b4e78adbc511da74ee6b4ba8d345bda07c672170a18e821f706f76ccadf: Cannot kill container 46349b4e78adbc511da74ee6b4ba8d345bda07c672170a18e821f706f76ccadf: connection error: desc = "transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused": unknown

ERROR: for dockerlnmp_nginx_1  cannot stop container: 9ac5f47aca0368bd004ca702e1d21bda392136969b11278959ef255a25093fab: Cannot kill container 9ac5f47aca0368bd004ca702e1d21bda392136969b11278959ef255a25093fab: connection error: desc = "transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused": unknown

ERROR: for dockerlnmp_svn_1  cannot stop container: 6c1e0ee992f6097850a69a68386a53e856c08ce7e9e5c5fb370d9ae44525bed3: Cannot kill container 6c1e0ee992f6097850a69a68386a53e856c08ce7e9e5c5fb370d9ae44525bed3: connection error: desc = "transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused": unknown

#2 top 查到服务器状态

服务器状态

#3 监控平台状态

#4 在cpu使用率占100%的时候, 无法查看docker每个容器使用服务器资源情况

docker-状态

将docker升级后16天正常

env

  • Docker version 17.12.1-ce, build 7390fc6
  • docker-compose version 1.18.0, build 8dd22a9