По какой-то причине сегодня, когда я выкатил новую версию для одного из наших развертываний, модуль застрял в ContainerCreating с такими событиями ошибки:
1h 1m 37 some-api-2275263275-01pq7 Pod Warning FailedMount {kubelet gke-cluster-1-default-pool-4399eaa3-os4v} Unable to mount volumes for pod "some-api-2275263275-01pq7_default(afc5ae68-5b5e-11e6-afbb-42010a800105)": timeout expired waiting for volumes to attach/mount for pod "some-api-2275263275-01pq7"/"default". list of unattached/unmounted volumes=[default-token-880jy]
1h 1m 37 some-api-2275263275-01pq7 Pod Warning FailedSync {kubelet gke-cluster-1-default-pool-4399eaa3-os4v} Error syncing pod, skipping: timeout expired waiting for volumes to attach/mount for pod "some-api-2275263275-01pq7"/"default". list of unattached/unmounted volumes=[default-token-880jy]
Затем я попытался масштабировать кластер, и более 75% ранее запущенных модулей перешли на ContainerCreating и тоже там застряли. Это привело к массовым сбоям в нашей системе, и мне пришлось быстро создать новый кластер.
Мы используем контейнерный движок облачной платформы Google, а версия кластера - 1.3.2.
@montanaflynn В исправлены в версии 1.3.4 . Вы, вероятно, попали в одну из них.
Если вы поделитесь полными /var/log/kubelet log
с узла с зависшим развертыванием, я могу взглянуть и подтвердить, известная ли это проблема или нет. Мне также понадобится ваше имя проекта GKE / имя кластера / зона, чтобы получить ваши главные журналы. Не стесняйтесь, напишите мне, если вы не хотите делиться публично.
Я видел аналогичную проблему с версией 1.3.3, но в моем случае основная причина была гораздо более простой. Для моего развертывания требуется том секретов, и я забыл создать связанный секрет для кластера, в котором я пытался выполнить новое развертывание. Я не видел ошибок при использовании kubectl describe
или kubectl logs
но в конце концов понял, что развертывание застряло в состоянии ContainerCreating
(без журналов afaict), если том, от которого оно зависело, отсутствует.
Этот выпуск устарел. Закрытие.
Самый полезный комментарий
Я видел аналогичную проблему с версией 1.3.3, но в моем случае основная причина была гораздо более простой. Для моего развертывания требуется том секретов, и я забыл создать связанный секрет для кластера, в котором я пытался выполнить новое развертывание. Я не видел ошибок при использовании
kubectl describe
илиkubectl logs
но в конце концов понял, что развертывание застряло в состоянииContainerCreating
(без журналов afaict), если том, от которого оно зависело, отсутствует.