Kubeadm: 1.10へのKubeadmアップデートがhak8s / etcdクラスターで失敗する

作成日 2018年05月20日 · 13コメント · ソース: kubernetes/kubeadm

バグレポート

バージョン

kubeadmバージョン：1.10.2

環境：

Kubernetesバージョン：1.9.3
クラウドプロバイダーまたはハードウェア構成：3 xk8sマスターHA
OS ：RHEL7
カーネル：3.10.0-693.11.6.el7.x86_64

何が起こった？

数か月前、「公式」ドキュメントhttps://kubernetes.io/docs/setup/independent/high-availability/に従って、 kubeadm 1.9.3を使用してkubernetes 1.9.3HAクラスターを作成しました。 etcd静的ポッドを使用してマスターノードでホストしているHAクラスター

最新のkubeadmを使用してクラスターをk8s 1.10.2にアップグレードしたかった; kubeadm更新した後、 kubeadm upgrade planを実行すると、次のエラーが発生しました。

[root@shared-cob-01 tmp]# kubeadm upgrade plan
[preflight] Running pre-flight checks.
[upgrade] Making sure the cluster is healthy:
[upgrade/config] Making sure the configuration is correct:
[upgrade/config] Reading configuration from the cluster...
[upgrade/config] FYI: You can look at this config file with 'kubectl -n kube-system get cm kubeadm-config -oyaml'
[upgrade/plan] computing upgrade possibilities
[upgrade] Fetching available versions to upgrade to
[upgrade/versions] Cluster version: v1.9.3
[upgrade/versions] kubeadm version: v1.10.2
[upgrade/versions] Latest stable version: v1.10.2
[upgrade/versions] FATAL: context deadline exceeded

問題を調査したところ、2つの根本原因が見つかりました。

1） `kubeadm`は、TLSが有効になっているとして`etcd`クラスターを識別しません

ガイドは、 etcd静的ポッドで次のコマンドを使用するように指示します

- etcd --name <name> \
  - --data-dir /var/lib/etcd \
  - --listen-client-urls http://localhost:2379 \
  - --advertise-client-urls http://localhost:2379 \
  - --listen-peer-urls http://localhost:2380 \
  - --initial-advertise-peer-urls http://localhost:2380 \
  - --cert-file=/certs/server.pem \
  - --key-file=/certs/server-key.pem \
  - --client-cert-auth \
  - --trusted-ca-file=/certs/ca.pem \
  - --peer-cert-file=/certs/peer.pem \
  - --peer-key-file=/certs/peer-key.pem \
  - --peer-client-cert-auth \
  - --peer-trusted-ca-file=/certs/ca.pem \
  - --initial-cluster etcd0=https://<etcd0-ip-address>:2380,etcd1=https://<etcd1-ip-address>:2380,etcd2=https://<etcd2-ip-address>:2380 \
  - --initial-cluster-token my-etcd-token \
  - --initial-cluster-state new

kubeadm >= 1.10チェック（ここ：https：//github.com/kubernetes/kubernetes/blob/release-1.10/cmd/kubeadm/app/util/etcd/etcd.go#L56） etcdは、static podコマンドで次のフラグの存在を確認することにより、TLSを有効にします。

"--cert-file=",
"--key-file=",
"--trusted-ca-file=",
"--client-cert-auth=",
"--peer-cert-file=",
"--peer-key-file=",
"--peer-trusted-ca-file=",
"--peer-client-cert-auth=",

しかし、フラグ--client-cert-authと--peer-client-cert-authがパラメーターなしの命令で使用されているため（ブール値）、 kubeadmはetcdクラスターがTLSを持っていることを認識しませんkubeadmた有効。

個人的な修正：
etcd静的ポッドコマンドを更新して、 - --client-cert-auth=trueと- --peer-client-cert-auth=true

一般的な修正：
--client-cert-auth=trueと--peer-client-cert-auth=trueを使用するように手順を更新し、 "--peer-cert-file"と"--peer-key-file"を使用してkubeadmチェックを緩和します（等しいものなし）

2） `kubeadm`が正しい証明書を使用しなかった

ポイント1を修正した後も、 kubeadmが適切な証明書を使用していなかったため、問題は解決しませんでした。
実際、kubeadm HAガイドに従うと、作成される証明書はca.pem ca-key.pem peer.pem peer-key.pem client.pem client-key.pemしかし、最新のkubeadmは、代わりにca.crt ca.key``peer.crt peer.key``healthcheck-client.crt healthcheck-client.key期待しています。
kubeadm-config MasterConfigurationキーetcd.caFile 、 etcd.certFile 、およびetcd.keyFileは無視されます。

個人的な修正：
.pem証明書の名前を.crtおよび.key相当するものに変更し、それらを使用するようにetcd静的ポッド構成を更新しました。

一般的な修正：
kubeadm-config data.caFile 、 data.certFile 、およびdata.keyFile値を使用して、etcd静的ポッド定義（ポッドパス+ボリュームhostPath）から適切な証明書を推測するか、作成します。アップグレード中に使用する新しい一時クライアント証明書。

あなたは何が起こると思っていましたか？

アップグレード計画は正しく実行されている必要があります

それを（可能な限り最小限かつ正確に）再現する方法は？

https://kubernetes.io/docs/setup/independent/high-availability/に従ってkubeadm 1.9.3を使用してk8s haクラスターを作成し、最新のkubeadmを使用してk8s >= 1.10に更新してみますkubeadm

areHA areUX areupgrades documentatioimprovement kinbug prioritimportant-soon

ソース

brokenmass

全てのコメント13件

この問題はkubeadm 1.10.3で修正されているようですが、静的なetcdポッドは「外部」として認識されるため、自動的には更新されません。

brokenmass 2018年05月22日

kubeadm 1.10.3を使用していますが、同じ問題が発生します。私のクラスターは1.10.2で、外部のセキュアなetcdがあります

FloMedja 2018年05月22日

@brokenmassあなたが気付いた2番目の原因に対するあなたの

  caFile: /etc/kubernetes/pki/etcd/ca.crt
  certFile: /etc/kubernetes/pki/etcd/healthcheck-client.crt
  keyFile: /etc/kubernetes/pki/etcd/healthcheck-client.key

FloMedja 2018年05月22日

@detiber助けてくれませんか？

FloMedja 2018年05月22日

@FloMedja
私の場合、値は次のようになります。

  caFile: /etc/kubernetes/pki/etcd/ca.pem
  certFile: /etc/kubernetes/pki/etcd/client.pem
  keyFile: /etc/kubernetes/pki/etcd/client-key.pem

および1.10.3は正しく機能しています

brokenmass 2018年05月23日

@brokenmassしたがって、kubeadm 1.10.3を使用すると、個人的な修正を必要とせずにすべてが機能します。この場合、私は少し混乱しています。私はkubeadm1.10.3を持っていますが、このバグレポートで言及したのと同じエラーメッセージが表示されます。私は自分の設定を再確認します私は他の場所でいくつかの間違いを犯している可能性があります

FloMedja 2018年05月23日

ここに追加します（またはkubernetes slackに参加して直接メッセージを送ってください）kubeadm-configなどの静的ポッドymlとkubeadm upgrade plan完全な出力

brokenmass 2018年05月23日

申し訳ありませんが、私はちょうど今これを見ています。 @chuckhaは、静的ポッドHA etcdドキュメントの元の作業を行いました。今後数日間、彼と協力して、HAのアップグレードをまっすぐにするのに役立つかどうかを確認します。

detiber 2018年05月24日

👍1

@detiberありがとうございます。アップグレード計画はついに機能します。しかし、クラスターをアップグレードしようとすると、いくつかの競合状態の問題に直面します。動作する場合もあれば、 kubernetes / kubeadm / issues / 850と同じエラーが発生する場合もあります。 1つのノードでポッドを再起動しようとすると、kubeadmが競合状態になります。

FloMedja 2018年05月24日

今日、このためのテストenvセットアップを取得する際にいくつかの問題が発生し、週末が始まる前に時間が不足しています。私は来週の初めにこれを取り戻すつもりです。

detiber 2018年05月25日

👍1

/ assign @chuckha @detiber

timothysc 2018年05月25日

@chuckha @detiber @stealthyboxこれに関する更新はありますか？

luxas 2018年06月12日

したがって、1.9-> 1.10 HAアップグレードは、サポートされていない、または精査されたパスではありませんでした。

現在、1.11-> 1.12のドキュメントの更新を進めており、今後も維持する予定です。

timothysc 2018年08月29日

😕1

このページは役に立ちましたか？

0 / 5 - 0 評価

Kubeadm: 1.10へのKubeadmアップデートがhak8s / etcdクラスターで失敗する

バグレポート

バージョン

何が起こった？

1） kubeadmは、TLSが有効になっているとしてetcdクラスターを識別しません

2） kubeadmが正しい証明書を使用しなかった

あなたは何が起こると思っていましたか？

それを（可能な限り最小限かつ正確に）再現する方法は？

全てのコメント13件

関連する問題

1） `kubeadm`は、TLSが有効になっているとして`etcd`クラスターを識別しません

2） `kubeadm`が正しい証明書を使用しなかった