Flynn: Controller, Scheduler: Die Einschränkung für die Duplizierung von Jobereignissen wurde behoben

Erstellt am 9. Sept. 2016  ·  4Kommentare  ·  Quelle: flynn/flynn

Derzeit erstellen wir nur ein einzelnes Ereignis pro Job-ID und Status (siehe hier ). Es ist jedoch möglich, dass ein Job zweimal in einen bestimmten Status wechselt.

Wenn beispielsweise ein Host vom Scheduler als fehlerhaft eingestuft wird, werden alle Jobs auf diesem Host als nicht verfügbar markiert. Wenn der Host jedoch zurückkommt, werden die Jobs möglicherweise noch ausgeführt, sodass die Jobs wieder in den laufenden Zustand versetzt werden. Nachfolgende Bereitstellungen, an denen diese Jobs beteiligt sind, schlagen dann fehl, da keine Ausfallereignisse ausgegeben werden (das Ausfallereignis ist bereits vorhanden, als der Host fehlerhaft wurde).

Einige Optionen:

  • Löschen Sie die eindeutige Einschränkung (Sie müssen darüber nachdenken, ob davon ausgegangen wird, dass die Ereignisse nicht dupliziert werden).
  • Wenn der Scheduler Jobs als nicht verfügbar markiert, stoppen Sie sie einfach, wenn sie erneut ausgeführt werden, da Ersatzjobs bereits gestartet wurden

@titanous @josephglanville @jvatic Gedanken?

componencontroller componenscheduler kinbug

Hilfreichster Kommentar

Alternativ könnte ein anderer Status für Jobs hinzugefügt werden, die weg sind, weil der Host weggegangen ist.

Alle 4 Kommentare

Wenn der Scheduler Jobs als nicht verfügbar markiert, stoppen Sie sie einfach, wenn sie erneut ausgeführt werden, da Ersatzjobs bereits gestartet wurden.

Ich denke, das ist die richtige Antwort.

Alternativ könnte ein anderer Status für Jobs hinzugefügt werden, die weg sind, weil der Host weggegangen ist.

@titanous Ich denke nicht, dass das Hinzufügen eines neuen Status für Jobs auf nicht verbundenen Hosts wirklich helfen wird.

Wenn der Scheduler erneut eine Verbindung zu einem Host herstellt, dessen Jobs zuvor als gestoppt markiert waren (oder in einen anderen Status wie unknown ), muss er noch eine Entscheidung treffen, ob nur noch laufende Jobs gestoppt oder versucht werden sollen und Markieren Sie sie als erneut ausgeführt (was dazu führt, dass up Ereignisse im Controller dupliziert werden).

Ich denke, wir sollten einfach damit beginnen, die Jobs sofort nach der erneuten Verbindung zu stoppen.

Flynn ist nicht gewartet und unsere Infrastruktur wird am 1. Juni 2021 heruntergefahren. Weitere Informationen finden Sie in der README- Datei.

War diese Seite hilfreich?
0 / 5 - 0 Bewertungen

Verwandte Themen

onnimonni picture onnimonni  ·  3Kommentare

amingilani picture amingilani  ·  4Kommentare

heldopslippers picture heldopslippers  ·  4Kommentare

IsNull picture IsNull  ·  5Kommentare

hadifarnoud picture hadifarnoud  ·  3Kommentare