バグレポート:
kubeadm
バージョン1.7
が時々永遠にハングするのがわかります
[reset] Removing kubernetes-managed containers
この問題は5回のうち4回再現でき、終了するにはCTRL+C
を押す必要がありました。
$ sudo kubeadm reset
sudo: unable to resolve host vhosakot-aci-1-w9c2681796d
[preflight] Running pre-flight checks
[reset] Stopping the kubelet service
[reset] Unmounting mounted directories in "/var/lib/kubelet"
[reset] Removing kubernetes-managed containers
^C <--- Pressed CTRL+C to exit
$
sudo systemctl restart docker.service
を実行してdockerを再起動すると、この問題が解決し、 sudo kubeadm reset
は問題なく正常に機能します。
kubeadm reset
kubernetesで管理されているコンテナを削除するときにdockerの状態をチェックし、dockerが異常な場合は、次の場所で永久にハングするのではなく、タイムアウトすると便利です。
[reset] Removing kubernetes-managed containers
kubeadmバージョン:
$ kubeadm version
kubeadm version: &version.Info{Major:"1", Minor:"7", GitVersion:"v1.7.11", GitCommit:"b13f2fd682d56eab7a6a2b5a1cab1a3d2c8bdd55", GitTreeState:"clean", BuildDate:"2017-11-25T17:51:39Z", GoVersion:"go1.8.3", Compiler:"gc", Platform:"linux/amd64"}
環境:
$ kubectl version
Client Version: version.Info{Major:"1", Minor:"7", GitVersion:"v1.7.11", GitCommit:"b13f2fd682d56eab7a6a2b5a1cab1a3d2c8bdd55", GitTreeState:"clean", BuildDate:"2017-11-25T18:34:52Z", GoVersion:"go1.8.3", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"7", GitVersion:"v1.7.12", GitCommit:"3bda299a6414b4866f179921610d6738206a18fe", GitTreeState:"clean", BuildDate:"2017-12-29T08:39:49Z", GoVersion:"go1.8.3", Compiler:"gc", Platform:"linux/amd64"}
$ sudo cat /etc/os-release
sudo: unable to resolve host vhosakot-aci-1-m3710102e28
NAME="Ubuntu"
VERSION="16.04.3 LTS (Xenial Xerus)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 16.04.3 LTS"
VERSION_ID="16.04"
HOME_URL="http://www.ubuntu.com/"
SUPPORT_URL="http://help.ubuntu.com/"
BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"
VERSION_CODENAME=xenial
UBUNTU_CODENAME=xenial
$ uname -a
Linux vhosakot-aci-1-m3710102e28 4.4.0-104-generic #127-Ubuntu SMP Mon Dec 11 12:16:42 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
$ sudo docker info
sudo: unable to resolve host vhosakot-aci-1-w9c2681796d
Containers: 13
Running: 9
Paused: 0
Stopped: 4
Images: 11
Server Version: 1.13.1
Storage Driver: aufs
Root Dir: /var/lib/docker/aufs
Backing Filesystem: extfs
Dirs: 67
Dirperm1 Supported: true
Logging Driver: json-file
Cgroup Driver: cgroupfs
Plugins:
Volume: local
Network: bridge host macvlan null overlay
Swarm: inactive
Runtimes: runc
Default Runtime: runc
Init Binary: docker-init
containerd version: (expected: aa8187dbd3b7ad67d8e5e3a15115d3eef43a7ed1)
runc version: N/A (expected: 9df8b306d01f59d3a8029be411de015b7304dd8f)
init version: N/A (expected: 949e6facb77383876aeff8a6944dde66b3089574)
Security Options:
apparmor
seccomp
Profile: default
Kernel Version: 4.4.0-104-generic
Operating System: Ubuntu 16.04.3 LTS
OSType: linux
Architecture: x86_64
CPUs: 3
Total Memory: 15.67 GiB
Name: vhosakot-aci-1-w9c2681796d
ID: X3ES:DTHR:RVNF:6OCE:2UXA:5VKA:LVVS:2G4K:KYHN:EBQZ:QH4C:SIQB
Docker Root Dir: /var/lib/docker
Debug Mode (client): false
Debug Mode (server): false
Registry: https://index.docker.io/v1/
WARNING: No swap limit support
Experimental: false
Insecure Registries:
127.0.0.0/8
Live Restore Enabled: false
$ sudo docker version
sudo: unable to resolve host vhosakot-aci-1-w9c2681796d
Client:
Version: 1.13.1
API version: 1.26
Go version: go1.6.2
Git commit: 092cba3
Built: Thu Nov 2 20:40:23 2017
OS/Arch: linux/amd64
Server:
Version: 1.13.1
API version: 1.26 (minimum version 1.12)
Go version: go1.6.2
Git commit: 092cba3
Built: Thu Nov 2 20:40:23 2017
OS/Arch: linux/amd64
Experimental: false
kubeadm reset
は永遠にハングします。
Dockerが不健康な場合、 kubeadm reset
タイムアウトします。
上記の手順を参照してください。
私もこれを見ます:
〜sudokubeadmリセット[プリフライト]プリフライトチェックの実行[リセット] kubeletサービスを停止します[リセット]「/ var / lib / kubelet」内のマウントされたディレクトリのアンマウント[リセット] kubernetesで管理されているコンテナの削除〜
起こっているように見えるのは、くさび形のnfsマウントが原因でdocker kill / rmが動揺することです
@vhosakotそれはおそらくあなたにとってもそのようなものでしょうか? それはマウントポイントがスタックしていますか?
@cwedgwoodマウントポイントがありませんが、まだこの問題が発生しています。
sudo systemctl restart docker.service
を実行してdockerを再起動すると、この問題が解決し、 sudo kubeadm reset
は問題なく正常に機能します。
/ assign @ detiber-これはドキュメントの更新です。
/ assign @chuckha
私はこれを取ることができます。
https://kubernetes.io/docs/setup/independent/troubleshooting-kubeadm/に情報を追加する
より良い場所がない限り
^ PRが/website
送信されました。 これに関する十分なデバッグ情報がありませんが、 @ vhosakotが提供した修正を
最も参考になるコメント
@cwedgwoodマウントポイントがありませんが、まだこの問題が発生しています。
sudo systemctl restart docker.service
を実行してdockerを再起動すると、この問題が解決し、sudo kubeadm reset
は問題なく正常に機能します。