Probleme im Netzwerk stören Clusterbetrieb

Queues wurden angehalten

19.07.2025

+++ Update 2025-07-22 +++ Queues reaktiviert

+++ Update 2025-07-22

Das Routingproblem ist behoben, die Queues wurden reaktiviert.

+++

Seit dem Wochenende treten Netzwerkprobleme (vermutlich im Routing) auf, die einen zuverlässigen Clusterbetrieb nicht mehr zulassen.

Wegen des dadurch nicht verläßlichen Zugriffs auf externe Ressourcen (wie zentrale oder Instituts-Lizenzserver etc) haben wir vorerst alle Queues gestoppt.

Dadurch starten im Moment keine wartenden Jobs – bereits laufende sind davon nicht betroffen und können (sofern sie keine externen Resourcen benötigen) hoffentlich erfolgreich beendet werden.

Ein weiteres Symptom des Problems ist, dass Loginversuche in das Cluster von einem PC aus fehlschlagen können, während sie von einem anderen aus funktionieren.

Sowie das Problem behoben ist, reaktivieren wir die Queues wieder – und Anmeldeversuche an den Loginknoten sollten dann auch wieder zuverlässig funktionieren.