Flannel: Manejar la concesión de subred que expira

Creado en 29 ago. 2014  ·  6Comentarios  ·  Fuente: coreos/flannel

Aunque flannel comenzará a renovar el contrato de arrendamiento una hora antes de su vencimiento, aún podría perderse: por ejemplo, la suspensión de la máquina virtual. Flannel debería intentar obtener la misma asignación de subred si todavía está disponible, pero recurrir a un nuevo arrendamiento y señalar el hecho.

aredocumentation kinenhancement

Comentario más útil

¿Hay algún trabajo en marcha para esto? Sería increíblemente útil ya que en este momento si una máquina pierde un contrato de arrendamiento y obtiene uno nuevo, procesa cualquier contenedor en la máquina sin conectividad de red.

Todos 6 comentarios

¿Hay algún trabajo en marcha para esto? Sería increíblemente útil ya que en este momento si una máquina pierde un contrato de arrendamiento y obtiene uno nuevo, procesa cualquier contenedor en la máquina sin conectividad de red.

Una idea de implementación para esto está en #610

También vea #520 para algunas buenas preguntas sobre cómo la franela maneja esto en este momento.

Al solucionar esto, debemos asegurarnos de que este escenario de falla se discuta claramente en los documentos.

FWIW, el diseño del sistema en el que hemos convergido para Cloud Foundry es que a los hosts se les asigna preferentemente su arrendamiento anterior, incluso si "venció". Y si aparece un nuevo host, se le asigna una concesión en el siguiente orden de prioridad:

  • prefiera subredes que nunca antes se hayan entregado, o subredes que fueron renunciadas explícitamente por un host de terminación limpia.
  • si ninguno de ellos existe, solo entonces el nuevo host se hace cargo de un contrato de arrendamiento vencido y, en ese caso, elige el contrato de arrendamiento más antiguo.

Esto tiene como objetivo minimizar la probabilidad de que se "robe" una concesión de un host de contenedor activo, pero particionado. Pero si eso ocurre, una vez que la partición se recupere y el host "víctima" se vuelva a conectar, descubrirá que su concesión ya no es válida. En este caso, el host de la víctima cae en un modo de falla ruidoso especial que (1) evitará que se programen nuevas cargas de trabajo y (2) activará el sistema de orquestación para evacuar cualquier carga de trabajo existente. Una vez que se complete la evacuación, el host limpiará cualquier estado de red sobrante (por ejemplo, eliminará el dispositivo VXLAN), adquirirá una nueva concesión para sí mismo y comenzará a aceptar nuevas cargas de trabajo.

Creemos que este es el plan correcto. Comentarios bienvenidos.

Esto ahora está arreglado en v0.8.0

¿Fue útil esta página
0 / 5 - 0 calificaciones