-
Behoben: Ausfall des cluster-weiten Filesystems
04.11.2024
Der Fehler ist behoben, das System steht wieder zur Verfügung.
+++ Update 17:00: Das Deadlock-Problem ließ sich nur durch (teilweise hartes) Neustarten diverser GPFS-Master- und aller Rechenknoten lösen. Dadurch sind leider alle Jobs abgebrochen worden, die zu diesem Zeitpunkt liefen. Falls Sie das nicht explizit (durch spezielle Parameter) unterbunden haben, wird der Scheduler solche abgebrochenen Jobs selbständig neu starten. +++
-
Neue Standards bei OpenMP- und hybriden Programmen
24.10.2024
Zwei neue Umgebungsvariablen für OMP
-
HLR und Housing in L5|08: Auszeit
30.09.2024
für Arbeiten an der Stromversorgung
Für die endgültige Reparatur der 2000A-Stromschiene des Serverraums muss das HPC-System abgeschaltet werden.
-
HLR-Störung infolge Ausfall des Kältesystems
05.05.2024
Störung ist inzwischen behoben und der HLR arbeitet wieder.
-
Betrieb mit reduzierter Kapazität
08.02.2024
Lichtenberg Cluster nach Ausfall wieder in Teilbetrieb
Durch einen Kurzschluss war die gesamte elektrische Versorgung des Hochleistungsrechners nicht funktionstüchtig. Mittlerweile ist der Cluster wieder verfügbar, allerdings mit reduzierter Kapazität (~35%).